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(mining‏ هو نهج معالجة اللغة الطبيعية (NLP)‏ لتحدید الايجابية positivity‏ أو السلبية 
negativity‏ أو الحيادية neutrality‏ البیانات. يتم استخدام تحلیل المشاعر بشکل متکرر على 
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والتعلم الالي؟ لقد جشت إلى المکان المناسب.في هذا الکتاب. سنمر بالعدید من مشاریع تحلیل 
المشاعر التى قد تستخدمها لاثبات فهمك واختبار معلوماتك. 

لقد حاولت قدر المستطاع ان اترجم المشاریع الأكثر طرحأني مجال تحلیل المشاعر مع الشرح 
المناسب والكافي. ومع هذا یبقی عملاً بشریاً یحتمل النقص. فاذا كان لديك أي ملاحظات حول 
هذا الکتاب. فلا تتردد بمراسلتنا عبر بریدنا الالكتروني alaa.taima(g)qu.edu.iq‏ . 

نأمل ان یساعد هذا الکتاب کل من يريد ان يدخلفي مجالات المعالجة اللغوية الطبيعية 
وتحلیل المشاعر ومساعدة القاری العربي على تعلم هذه المجالات. اسأل الله التوفيقفي هذا العمل 
لأثراء المحتوی العربي الذي یفتقر آشد الافتقار إلى محتوی جيد ورصین‌في المعالجة اللغوية 
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ماهوتدليل المشاعرة 


0 ماهو تحلیل المشاعر؟ What is Sentiment Analysis‏ 
أصبح تحلیل المشاعر Sentiment analysis‏ جزءًا لا يتجزأ من تسویق المنتجات وتجرية 
المستخدم. حيث تلجأ الشركات والمستهلكون على حد سواء إلى الموارد عبر الإنترنت للحصول 
على تعليقات على المنتجات والخدمات.في هذه المقالة» سأشرح ما هو تحليل المشاعرفي التعلم 

الآلى. 


ماهو تحليل المشاعر؟ 

آراء الآخرين لها تأثير كبير على عملية صنع القرار اليومية لدينا. تتراوح هذه القرارات من شراء 
منتج مثل الهاتف الذكي إلى الاستثمارفني اختيار مدرسة. وجميع القرارات التي تؤثر على جوانب 
مختلفة من حياتنا اليومية. قبل الانترنت. سعى الأشخاص للحصول على آراء حول المنتجات 
والخدمات من مصادر مثل الأصدقاء أو الأقارب أو تقارير المستهلكين. 


ومع GUS‏ عصر الإنترنت» أصبح من الأسهل بكثير جمع الآراء المتنوعة من مختلف 
ااشخاص‌ني جميع أنحاء العالم. يتطلع الأشخاص إلى مراجعة المواقع ومواقع التجارة 
الإلكترونية ومواقع الرأي عبر الإنترنت ووسائل التواصل الاجتماعي للحصول على تعليقات حول 
كيفية عرض منتج أو خدمة معينةفي السوق. وبالمثل» تستخدم المنظمات استطلاعات الرأي 
polls‏ واستطلاعات الرأي opinion polls‏ ووسائل التواصل الاجتماعي US‏ للحصول على 
تعليقات على منتجاتها وخدماتها. 


تحليل المشاعر هو الدراسة الحسابية للآراء والمشاعر والعواطف المعبر عنهافي النص.في ele‏ 
البيانات والتعلم الالي» يتم استخدام تحليل المشاعر بشكل متزايد OY‏ المعلومات التي يولدها 
يمكن أن تؤدي إلى تسییل المنتجات والخدمات. 


على سول الان من خلال الصو علی تعلیقات المستهلکین حول didus The‏ سكن 
للموسسة قياس نجاح الحملة أو تعلم تعدیلها لتحقیق مزید من النجاح. تعد مراجعات المنتجات 
Product reviews‏ مفيدة Call‏ لانشاء منتجات آفضل. والتي يمكن أن يكون لها تأثير مباشر 
على الایرادات. ‏ وکذلك لمقارنة العروض من المنافسین. 


Sentiment analysis 


تحليل المشاعر: عن طريق اامثلة 


تعبر الكلمات عن آنواع مختلفة من المشاعر التي يمكن أن تكون إيجابية أو سلبية أو قوية أو 
ضعيفة. لإجراء تحليل المشاعر من المهم فهم قطبية الكلمات وتصنيف المشاعر إلى فتات مثل 
الإيجابية positive‏ آو السلبية negative‏ آو المحايدة neutral‏ يمكن إنجاز هذه المهمة من 
خلال استخدام خوارزمیات التعلم الالي. باستخدام التعلم الالي یمکننا تصنیف ما إذا كانت 
الکلمات لها مشاعر إيجابية أو سلبية. 


ومع ذلك. لا تزال هناك بعض التحدیات التي يجب التغلب علیها قبل أن يصبح تحلیل المشاعر 
أداة مثالية آکثر. على سبیل المثالء لا یزال الحکم البشري آکثر دقة كمقياسفي تحلیل المشاعر. 
لا تستطيع الأنظمة الالية التمییز بين السخرية sarcasm‏ والنص الصادق «sincere text‏ ولا 
يمكنها دائمًا تحليل المعنى السياقي المحدد للكلمة بشكل صحيح. يطرح استخدام الاختصارات 
مثل "101" أو اختصارات الكلمات مشاكل في التفسير. 


بلا شك. هذا مجال متطور مع مجموعة متنوعة من التطبيقات المفيدة. على الرغم من صعوبة 
مهام تحليل المشاعر بسبب أصول معالجة اللغة الطبيعيةء فقد كان هناك الكثير من التقدمفي 


السنوات الأخيرة بسبب ارتفاع الطلب. لا ترغب الشركات فقطفي معرفة كيف ينظر المستهلكون 
إلى منتجاتها وخدماتهاء ولكن المستهلكين يريدون معرفة آراء الآخرين قبل اتخاذ قرارات الشراء. 


مشاريع التعلم الآلي على تصنيف المشاعر 
أتمنى أن تعرف الآن ما هو تحليل المشاعر وكيف يتم استخدام خوارزميات التعلم JW‏ لمهمة 
تصنيف المشاعر. فيما يلي بعض مشاريع التعلم الالي ely‏ على تحليل المشاعر: 


e‏ التنبؤ بنتائج الانتخابات الرئاسية باستخدام التغريدات. 
e‏ نموذج کشف الكلام الذي يحض على الكراهية. 
fii e‏ مراجعات الفيلم. 
e‏ تحلیل مراجعات منتجات أمازون. 
e‏ نموذج کشف الأخبار الكاذبة. 
أتمنى أن تكون قد أحببت هذا المقال حول ماهية تحليل المشاعر وما فائدة التعلم الآلي فيه. 
المصدر: 


https://thecleverprogrammer.com/2020/12/24/what-is-sentiment-analysis/ 


تحليل المشاعرباستخدا يايثون 


Sentiment Analysis with تحليل المشاعر باستخدام بايثون‎ (1 
Python 

في التعلم الآلي Machine Learning‏ يشير تحلیل المشاعر Sentiment analysis‏ إلى 
تطبيق معالجة اللغة الطبيعية natural language processing‏ واللغويات الحاسوبية 
computational linguistics‏ وتحليل النص text analysis‏ لتحديد وتصنيف الاراء 
الشخصيةفي المستندات المصدر.ني هذه المقالة. سأقدم لك مشروع التعلم الآلي حول تحليل 
المشاعر باستخدام لغة برمجة بايثون. 


ماهو تحليل المشاعر؟ 

يهدف تحليل المشاعر إلى تحديد موقف الكاتب تجاه موضوع أو القطبية السياقية العامة 
للمستند. يمكن أن يكون الموقف هو حكمه أو تقييمه أو حالته العاطفية أو التواصل العاطفى 
المقصود. | 


في تحلیل المشاعر. تتمثل المهمة الرئيسيةفي تحدید کلمات الرأي «opinion words‏ وهو آمر 
مهم ALU‏ کلمات الرآي هي موشرات سائدة على المشاعن وخاصة الصفات والظروف 
والأفعال على سبیل المخال: I love this camera. It's amazing!"‏ " 


تعرف کلمات الرآي Casi‏ باسم کلمات القطبية polarity words‏ أو کلمات المشاعر أو معجم 
الرأي «sentiment words‏ أو کلمات الرآي ly «opinion words‏ یمکن Ú gat‏ تقسیمها 
إلى نوعین: الکلمات الايجابية «positive words‏ على سبیل المثال. رائع Gol «wonderful‏ 
elegant‏ مذهل astonishing‏ والکلمات السلبية negative words‏ على سبیل المثال فظیع 
6 مقرف -poor 433 . disgusting‏ 


مشروع التعلم الآلي حول تحلیل المشاعر باستخدام بایئون 
Go‏ هذا القسم. سوف آخذك خلال مشروع التعلم الآلي حول تحلیل المشاعر باستخدام لغة 
برمجة بایشون. لنبداً باستیراد جمیع مکتبات بایثون ومجموعة البیانات dataset‏ الضرورية: 


import pandas as pd 

import numpy as np 

import matplotlib.pyplot as plt 

import seaborn as sns 

from sklearn.feature extraction.text import CountVectorizer 
count=CountVectorizer () 

data=pd.read_csv("Train.csv") 

data. head )( 


تحلیل المشاعر : عن طريق الامثلة 


text label 
0 1 grew up (b. 1965) watching and loving the Th... 0 
1 When | put this movie in my DVD player, and sa... 0 
2 Why do people who do not know what a particula... 0 
3 Even though | have great interest in Biblical ... 0 
4 Ima die hard Dads Army fan and nothing will e... 1 


بعد قراءة مجموعة البیانات التي تحتوي على 40 E‏ من تقییمات الأفلام من IMDB‏ نری أن 
هناك عمودین بارزین. آحدهما هو TEXT‏ الذي يحتوي على النقد والاخر هو LABEL‏ الذي 
يحتوي على O‏ ۰1 حيث 0-سلبي و 1-ايجابي. 


الآن دعنا نرسم توزیع البیانات: 


fig-plt.figure(figsize-(5,5)) 
colors-["skyblue",'pink'] 
pos-data[data['label']--1] 
neg=data[data['label']==0] 
ck-[pos['label'].count(),neg['label'].count()] 
legpie-plt.pie(ck,labels-["Positive","Negative"], 

autopct -'$1.1f$$', 

shadow = True, 

colors aco ous 

startangle = 45, 

explode-(0, 0.1)) 


Positive 


50.096 


dins‏ © ل 


ثم سنقوم باستیراد RE‏ أي عملية التعبیر المنتظم «regular expression‏ نستخدم هذه المكتبة 
لازالة علامات html‏ مثل "cas"‏ آو. لذلك كلما صادفنا هذه العلامات. فإننا نستبدلها بسلسلة 
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فارغة. ثم سنقوم Cal‏ بتعدیل الرموز التعبيرية التي یمکن أن نکون وجوهّا ضاحكة (:» وجه 
حزین: (آو حتی وجه مستاء: /. سنقوم بتغییر الرموز التعبيريةفی النهاية للحصول على مجموعة 
import re‏ 


def preprocessor (text): 
texte- re. sub lx 1 text) 


emojis=re.findall('(?::|; |=) (?:- 
( CBS ND) DS CDE) FEE) 
text=re.sub('[\W]+',' ',text.lower()) +\ 
WY soam (eres aus) seed. oU, V V 


TETUN EERE 
data['text']=data['text'] .apply (preprocessor) 


الآن» سأستخدم PorterStemmer‏ من nltk‏ لتبسيط البیانات وازالة التعقیدات غير الضرورية 
فى بياناتنا النصية: 


from nltk.stem.porter import PorterStemmer 
porter=PorterStemmer () 
def tokenizer (text): 
return text.split )( 
def تا‎ ۳ POLO ای تا‎ B 
return [porter.stem(word) for word in text.split()] 


تصوير الکلمات السلبية والایجابية 
لتصوير الکلمات السلبية والايجابية باستخدام سحابة الکلمات ewordcloud‏ سأقوم أولاً بإزالة 
کلمات التوقف :stopwords‏ 


import nltk 
nltk.download('stopwords') 

from nltk.corpus import stopwords 
stop-stopwords.words('english') 


from wordcloud import WordCloud 
positivedata - data[ data['label'] -- 1] 
positivedata -positivedata['text'] 
negdata = data[data['label'] == 0] 
negdata= negdata['text'] 


def wordcloud draw(data, color = 'white'): 
words = ' '.join(data) 
cleaned word = " ".join([word for word in words.split() 


if (word!='movie' and 
word! 1ك‎ 
1 
wordcloud = WordCloud(stopwords=stop, 
background_color=color, 
width=2500, 
height=2000 
( .generate (cleaned word) 
plt.figure(1,figsize=(10, 7)) 
plt.imshow (wordcloud) 
julie ASSN OEE v) 


Bi شاعر : عن طريق الا‎ Jl لیا‎ E 
plt.show() 


print("Positive words are as follows") 
wordcloud draw(positivedata, 'white') 
print("Negative words are as follows") 
wordcloud draw (negdata) 
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«beautiful «good «perfect «excellent dove الکلمات الايجابية التي يتم ابرازها هي‎ 
«stupid «problem «wasteful horrible والکلمات السلبية التي يتم |برازها هي:‎ kind 
.poor «bad «horrible 


تحلیل المشاعر باستخدام بایئون 


A 
Ol 


سأستخدم TF-IDF Vertorizer OW‏ لتحویل المستندات الأولية إلى مصفوفة میزات 
feature matrix‏ وهو آمر مهم جدا لتدریب نموذج التعلم الالي: 


from sklearn.feature extraction.text import TfidfVectorizer 
tfidf=TfidfVectorizer (strip accents-None,lowercase-False,prepr 
ocessor-None,tokenizer-tokenizer porter,use idf-True,norm-'12' 
,Smooth idf-True) 

y-data.label.values 

x-tfidf.fit transform(data.text) 


تدريب نموذج التعلم الآلي لتحلیل المشاعر 
الآن لتدریب نموذح التعلم IW‏ سأقسم البیانات إلى مجموعات تدریب بنسمة 50 BUIL‏ 
واختبار بنسبة 50 بالمائة: 

from sklearn.model selection import train test split 


y encen SEA E‏ مر عبات esta adn yes tama este‏ 2۲ را 
)© ای ری[ SUE f‏ مور Ze U‏ نت i m OSE‏ 


دعنا الآن ندرب نموذج التعلم الالي لمهمة تحلیل المشاعر باستخدام نموذج الانحدار اللوجستي 
:Logistic Regression‏ 


from sklearn.linear model import LogisticRegressionCV 
clf-LogisticRegressionCV(cv-6,scoring-'accuracy',random state- 
Ommesobs-imverbose-S masse 900) eite Prati sy CESED) 

W prel = لله‎ precet Tast) 

from sklearn import metrics 


# Model Accuracy, how often is the classifier correct? 
primu ceuracy M mcteniessacsunaccvls s conc c st VU Se رت‎ 


Accuracy: 0.89045 


L 
مش‎ 


تمنی أن تکون قد آحببت هذه المقالة حول تحلیل المشاعر باستخدام لغة برمجة بایشون. 


المصدر: 


https://thecleverprogrammer.com/2020/12/07/sentiment-analysis-with- 
python/ 


تيل ارام ها 


Sentiment Analysis with JJI المشاعر مع التعلم‎ Julai (2 
machine learning 

تحلیل المشاعر Sentiment analysis‏ هو العملية التی یمکن من خلالها قياس کل المحتوی 
كمياً لتمثيل آفکار ومعتقدات وآراء قطاعات Mem ALIS‏ من الصعب التقلیل من الاثار 
المترتبة على تحلیل المشاعر لزيادة انتاجية العمل. يعد تحلیل المشاعر احدی مهام البرمجة 
اللغوية العصبية NLP‏ الشائعة التي یحتاج کل عالم بیانات لادائها. 


على سبیل المثال» آنت طالبفي دورة تدريبية عبر الانترنت ولديك مشكلة. قمت بنشرهفي منتدی 
الفصل. لن یکون تحلیل المشاعر قادرًا على تحدید الموضوع الذي تعاني منه فحسب. بل Caf‏ 
تحدید مدی إحباطك» وتخصیص تعليقاتهم b,‏ لهذا الشعور. هذا يحدث بالفعل OY‏ 


التكنولوجيا موجودة بالفعل. 


تحلیل المشاعر مع التعلم الآلي 

آمل أن تکون قد فهمت ما يعنيه تحلیل المشاعر. سأقدم لك OW‏ طريقة سهلة للغاية لتحلیل 
المشاعر باستخدام التعلم الالي. تتضمن البيانات التي سأستخدمها 27481 تخريدة تم وضع 
علامة عليهاني مجموعة التدریب و3534 تغريدةفي مجموعة الاختبار. يمكنك بسهولة تنزیل 

:Pandas بهذه المهمة من خلال النظر إلى البیانات باستخدام‎ OW البیانات من هنا. لنبداً‎ 
import pandas as pd 
training = pd.read csv("train.csv") 
TEST PI reac! esv (Wrest esi) 


print ("Training data: \n",training.head() ) 
print ("Test Data: \n",test.head() ) 


Training data: 


textID ... sentiment 
0 077400081 ... neutral 
1 549e992a42 ... negative 
2 088c60f138 ... negative 
3 9642c003ef ... negative 
4 358bd9e861 ... negative 


[5 rows x 4 columns] 


Test Data: 

textID text sentiment 
0 f87dea47db Last session of the day http://twitpic.com/67ezh neutral 
1 96d74cb729 Shanghai is also really exciting (precisely -... positive 
2 eee518ae67 Recession hit Veronique Branquinho, she has to... negative 
3 601082688c6 happy bday! positive 
4 


33987a8ee5 http://twitpic.com/4w75p - I like it!! positive 


TIME 
معالجة البیانات‎ 


من أجل البساطة. لا نريد المبالغةفي التعامل مع جانب تنظیف البیانات «data cleaning‏ ولکن 
هناك بعض الأشياء البسيطة التى يمكننا القيام بها لمساعدة نموذح التعلم الآلى الخاص بنا 

بعض الاشياء البسيطة التي ب يام ب نموذج ي الخاص بنا على 
تحديد المشاعر. عملية تنظيف البيانات كالتالى: 


1 إزالة جميع الارتباطات التشعبية (hyperlinks)‏ من التغريدات. 
2 استيدال الاختصارات (contractions)‏ الشائعة. 
Jl 3‏ علامات الترقیم .(punctuation)‏ 


كعملية لاعداد البیانات. یمکننا انشاء دالة لتعیین تسمیات المشاعر إلى الأعداد الصحيحة 
واعادتها من الدالة: 


import re 


COMET ELON CECE = ("Eu evs "gum mor, Uu 

NE uon‏ ای wom‏ لا 

" olo E: Wolo: MOE, 

u aren't": "are not," 

" ce ele Ws owie © 

m ۵ تن نان‎ EES نان هی‎ MOE, 
" Sioorulein ics لمعب‎ ong s 
۳ ۷ ان نان‎ ies تا‎ MOE ۵ 
m tein تا‎ ES Tog 

"W sue, e s لا‎ M رجات‎ 

iU euim ("s Vou mot," 

" weren't": "were not," 

Hu MUSE Us 11151 Mg 


def prepare data(df:pd.DataFrame) -> pd.DataFrame: 


Clie [pee] = dle esse ٩ 

; ول و ودره‎ x; رح‎ E acas: N o p 

str(x)) [0])\ 
str.lower\ () 

5 apply(lambda x: 

replace words(x,contractions dict) ) 


df["label"] = df["sentiment"] .map) 
ug neutral": 1, "negative":0, 
"positive":2( 
( 

return df.text.values, df.label.values 
Cez replecs vorde (strings sti, Qule ORA EV: dA CE) s 

ror ky v ta CICERONE teans £ )( 

string = string.replace (k, v) 

return string 

train tweets, train labels = prepare data(train df) 
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test tweets, test labels = prepare data(test df) 
Tokenization الترميز‎ 

نحتاج OW‏ إلى تحویل كل تغريدة إلى رمز متجه واحد ذي طول ثابت - على وجه التحدید 

تکامل TFIDF‏ . للقيام WL‏ یمکننا استخدام Tokenizer()‏ المدمجفي c Keras‏ وهو مناسب 

لبیانات التدریب: 

from keras.preprocessing.text import Tokenizer 

tokenizer = Tokenizer )( 

۵۶6102 تم‎ iie OM Certs (lese cabin. EMECIES) 

train tokenized = 

tokenizer.texts to matrix(train tweets,mode-'tfidf') 


pese لت‎ — 
tokenizer.texts to matrix(test tweets,mode-'tfidf') 


نموذج التعلم (JU‏ لتحلیل المشاعر 
الان. سأقوم بتدریب نموذجنا على تحلیل المشاعر باستخدام خوارزمية تصنیف الغابات 
Random Forest Classification‏ العشوائية المقدمة من :Scikit-Learn‏ 


from sklearn.ensemble import RandomForestClassifier 
forest = RandomForestClassifier(n estimators-500, 
min samples leaf-2,o0b score-True,n jobs--1,) 
forest.fit(train tokenized,train labels) 
print(f"Train score: 
(ütoresbescore(traunmngetokendzedptradnglabelts)m ( 

BER (VOOS Score ) 6825 2512 OOM sco C ay) 


Train score: 0.7672573778246788‏ 
OOB score: 0.6842545758887959‏ 
تقييم النموذج في مجموعة الاختبار 
تسهل Scikit-Learn‏ استخدام کل من المصنف وبيانات الاختبار coy‏ خوارزمية مصفوفة 
الارتباك confusion matrix‏ تظهر الأداءفي مجموعة الاختبار على النحو التالی: 


DEME (iest Score: مرس‎ 13028815 sepas (test رمع‎ 25 2381 Test lelos) (( 


Test 560: 1 

معدل الدقة accuracy rate‏ ليس كبيرًا لأن معظم أخطائنا تحدث عند توقع الفرق بين المشاعر 

الإيجابية والحيادية والسلبية والحيادية» والتىفي المخطط الكبير للأخطاء ليست أسوأ شىء يمكن 

أن نمتلكه. على الرغم من أننا لحسن الحظ نادرًا ما نخلط بين الشعور الإيجابي والشعور السلبي 
والعكس صحيح. 


أتمنى أن تكون قد أحببت هذا المقال عن تحليل المشاعر. 


J m 5‏ ^ اعر : عن طريق الا ثلة 


المصدر: 


/https://thecleverprogrammer.com/2020/08/13/sentiment-analysis 
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Tinder باستخدام بایئون‎ Tinder تحليل مشاعر مراجعات‎ (3 
Reviews Sentiment Analysis using Python 

Tinder‏ هو أحد أكثر تطبیقات (dating)‏ المواعدة شیوعا. يربط الأشخاص الذین لدیهم 
اهتمامات مماثلة. للتحقق مما إذا كان Tinder‏ يساعد الأشخاص في العثور على شرکاء یمکننا 
تحليل مشاعر الناس حول .Tinder‏ هناك الكثير من المراجعات على متجر Google Play‏ 
حول .Tinder‏ یمکننا استخدام هذه البیانات لتحلیل مشاعر مستخدمي UU . Tinder‏ إذا 
كنت تريد معرفة LAS‏ تحليل مراجعات «Tinder‏ فهذه المقالة مناسية EKON‏ هذه المقالف سوف 
آخذك خلال مهمة مراجعة Tinder‏ لتحليل المشاعر باستخدام بايثون. 


تحليل مشاعر مراجعات Tinder‏ باستخدام بايثون 

يتم تنزیل مجموعة البیانات التي آستخدمها لمهمة تحلیل آراء Tinder‏ من .Kaggle‏ تم جمعها 
من مراجعات Tinder‏ على متجر OW Les Google Play‏ نستورد مکتبات بایشون ومجموعة 
البیانات اللازمة لبدء هذه المهمة: 


import pandas as pd 

import matplotlib.pyplot as plt 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
from wordcloud import WordCloud, STOPWORDS, 
ImageColorGenerator 

import nltk 

import re 

from nltk.corpus import stopwords 

import string 

data = pd.read csv("tinder google play reviews.csv") 
print (data.head()) 


reviewId userName \ 
@ gp:AOgpTOF5m-nY12XsKXO@IG-ZQtyvmjwKEp43ILLrhBs... Kreg Smith 
1 gp:AOqpTOFMaT26Mj-6hrp6ZI9gU5fzeVZQA9LugbFelxR... R.W. 
2 gp:AOqpTOGtOLCAxZzUINTStlykvQHfOuhW70JOMScukLj... Benjo cantor 
3 gp:AOqpTOGcid22skoO0XyvhV1kSpbdKUzx5Q1SIi5L1lOvc... Chris Plata 
4 gp:AOqpTOGzA20eNWEOUMBedTHGQfd60U7Qy48JpUcBT -x. . . Dave Midas 
userImage ١ 
60 https://play-lh.googleusercontent.com/a/AATXAJ... 
1 https://play-lh.googleusercontent.com/a-/AOhl4... 
2 https://play-lh.googleusercontent.com/a/AATXAJ... 
3 https://play-lh.googleusercontent.com/a/AATXAJ... 
4 https://play-lh.googleusercontent.com/a-/AOhl4... 
content score thumbsUpCount \ 
9 Got banned for life don't know why they won't ... 1 e 
1 I don't know why I was banned .. But I m not a... 3 8 
2 All gays even if your straight a a a T e 
3 You have to pay so much to even be seen on thi... 1 e 
4 I do not understand how so many people use thi... 2 e 


5 لي J‏ ^ اعر : عن طريق الا ثلة 


at replyContent repliedAt 


reviewCreatedVersion 
-21 04:10:44 
2-05-21 04:08:24 
2-05-21 04:00:10 
2-05-21 03:47:58 
-21 03:47:51 


13.6.1 
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في الانطباعات الأولى لمجموعة البیانات هذه. يمكنني رژية بعض القیم الخاليةفي بعض الاعمدة. 
لتحلیل مراجعات Tinder‏ نحتاج فقط إلى عمود المحتوی (content column)‏ لذلك 
دعونا ننشى مجموعة SEL‏ جديدة مع عمود المحتوی ونتحرك الی آبعد من ذلك: 


دعنا الآن نری ما إذا كانت لدینا قیم خاليةفي عمود المحتوی: 


يحتوي عمود المحتوی Call‏ على قيم خالية» فلنقم بازالة القیم الخالية والمضي قدمًا: 


data = data[["content"] ] 


data.isnull().sumQ 


data = data.dropna() 


Lyle هنا يتعين‎ «(sentiment analysis) الآن نجهز هذه البیانات لمهمة تحلیل المشاعر‎ bes 


= nltk.SnowballStemmer ("english") 


nltk.download('stopwords') 
stemmer 


stopword=set (stopwords.words('english") ) 


def clean(text): 


text = str(text).lower() 

tede = me culo (UNIS [| US YU, TEE) 

text = re.sub('https?://\S+|www\.\S+', '', text) 

text = re.sub('<.*?>+', '', text) 

text = re.sub('[$s]' 5 re.escape(string.punctuation), '', 
text) 

BME exeo Val, YU, qe) 

OE = re silo ( NONI, VV. exe) 

text = [word for word in text.split(' ') if word not in 
stopword] 

text-" ".join(text) 

text = [stemmer.stem(word) for word in text.split(' ')] 

text-" ".join(text) 


< data["content"].apply (clean) 


return text 
data["content"] 


دعنا الآن نلقي نظرة على نوع الکلمات التي یستخدمها الأشخاص في مراجعات Tinder‏ 


text = " ".join(i for i in data.content) 
stopwords = set (STOPWORDS) 

wordcloud = WordCloud(stopwords-stopwords, 
background color="white") .generate (text) 


interpolation='bilinear') 


plt.figure( figsize-(15,10)) 
plt.imshow (wordcloud, 
plt.axis ("off") 
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plt.show() 
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سأضيف BE OF‏ آعمدة أخرىفي مجموعة البیانات هذه على آنها ايجابية Positive"‏ " وسلبية 
Negative"‏ "ومحايدة "Neutral"‏ من خلال حساب درجات المشاعر (sentiment scores)‏ 


nltk.download('vader lexicon") 

sentiments = SentimentIntensityAnalyzer () 

SCOTS) ESOS EOE at‏ ما هام 5212217012285 N‏ = ادن تاو اه واه 
in data["content"] ]‏ 

data["Negative"] = [sentiments.polarity scores(i)["neg"] for i 
in data["content"] | 

Cara ll Neueral ll = اهاعدا‎ Polarity scores تعسو‎ oT: 
in data["content"] ] 

data = data[["content", "Positive", "Negative", "Neutral"] ] 
print (data.head )( ) 


content Positive Negative ١ 


6 got ban life dont know wont tell help way read... @.231 @.225 

1 dont know ban allow use tinder henceforth did... 0.371 0.108 

z gay even straight 1 A à 6.666 6.666 

3 pay much even seen app girl ever talk back bet... @.229 0.128 

4 understand mani peopl use app im mean ugli ive... 6.666 @.225 
Neutral 

8 0.544 

1 09.521 

2 1.000 

3 0.642 

4 0.775 


bes‏ الآن نلقي نظرة على نوع الكلمات التي يستخدمها الأشخاصفي التعليقات الإيجابية على 
:Tinder‏ 


OSES =" FON lL EOE 3L atin 
data['content'][data['Positive'] > data["Negative"]]]) 


تحليل المشاعر : عن طريق الامئلة 23 


stopwords = set (STOPWORDS) 

wordcloud = WordCloud(stopwords-stopwords, 
background _color="white") .generate (positive) 
plt.figure( figsize=(15,10) ( 
plt.imshow(wordcloud, interpolation-'bilinear') 
joie sexe (OEE) 


_ Seem problem م‎ 


ozir!” سس‎ 1 809 good loye: رام‎ 


Ul tinde £ app;-8oo 


plt.show() 
L reat هه اه‎ righ - yell great guod give featur w= Sit ape 
۴ End Erat 
3 E l look 
رر “€ مت‎ B actua good nice 
نا‎ 
m 


7 phone Mumbar 


۳۹۵ p Piste 
SN Peneet newnew peop way. Ste app 


on wont let 


bes‏ الآن نلقي نظرة على نوع الکلمات التي يستخدمها الأشخاصفي المراجعات السلبية ل 
:Tinder‏ 


negative -' '.join([i for i in 
data['content'][data['Negative'] > data["Positive"]]]) 
stopwords = set (STOPWORDS) 

wordcloud = WordCloud(stopwords-stopwords, 

background _color="white") .generate (negative) 
plt.figure( figsize=(15,10) ) 

plt.imshow(wordcloud, interpolation-'bilinear') 

jolie sexus (ETE) 

plt.show() 


account: ban WO at a apps: someth went 


fake CUP‏ ع 


© ~" keep crash custom servic 


went. d EE f | iei ع‎ 
م‎ rers artes an account 57 sen wl wont let 


bà 9 one- 
~Iwast=time 


pr thin 


ec ban.reason = 


€ appa 


تحلیل مشاعر مراجعات Tinder‏ باستخدام بایئون 


: Tinder psss نلقي نظرة على النتيجة الاجمالية لمشاعر‎ bes 


sum (data["Positive"]) 
sum (data["Negative"]) 
sum (data["Neutral"]) 


x 


y 
2 


def Sentiment score (a, O, Eh: 
if (a>b) and (a>c): 
print Posutive MN 
elif (b>a) and (b>c): 
print ("Negative "y 
else: 


print ("Neutral S TN 
sentiment score(x, y, z) 


Neutral ©‏ 
لذلك يكتب معظم المستخدمين تعليقات محايدة. دعونا نلقي نظرة على إجمالي جميع درجات 
المشاعر: 
prine LESSEE YW, x‏ 


print("Negative: ", y) 
DERE INeUEEAS Wy 2) 


Positive: 7 5 
Negative: 55438 1 
Neutral: 314250. 6 


كما تری. VI‏ أكثر بكثير من السلبي یمکننا القول إن معظم المستخدمین سعداء ب 

.Tinder 

الملخص 

هذه هي الطريقة التي یمکنك بها تنفیذ مهمة Tinder‏ تحلیل مشاعر مراجعات Tinder‏ 

باستخدام بايثون. هو أحد آکثر تطبیقات المواعدة شیوعا. يربط الأشخاص الذین لدیهم 

اهتمامات ممائلة. آمل أن تکون قد أحببت هذا المقال حول تحلیل المراجعات‌ي -Tinder‏ 
المصدر: 


https: //thecleverprogrammer.com/2022/05/24/tinder-reviews- 


sentiment-analysis-using-python/ 


تحليل المشاعر لمراجعات TikTok‏ باستخدام بايثون 5 


N 


TikTok باستخدام بایئون‎ TikTok المشاعر لمراجعات‎ Haj (4 
Reviews Sentiment Analysis using Python 

يعد TikTok‏ آحد آشهر تطبیقات الوسائط الاجتماعية الیوم. تشتهر بمقاطع الفیدیو القصيرة 
الخاصة بها. غالبا ما یستخدم الأشخاص هذا التطبیق لمشاهدة مقاطع فیدیو مسلية ومضحكة. 
على الرغم من محتواه الترفيهي إلا أن هذا التطبیق لا يحبه الجمیع. إذا تصفحت مراجعاته. 
فستجد مزیجا من الكراهية والدعم ل GTIKTok‏ جمیع آنحاء العالم. لذلك. bes‏ نحلل 
مراجعات TikTok‏ لمعرفة ما یشعر به الناس حول محتوی هذا التطبيق.في هذه JUI‏ سوف 
آطلعك على مهمة تحلیل المشاعر لمراجعات TikTok‏ باستخدام بایشون. 


تحلیل المشاعر لمراجعات TikTok‏ باستخدام بایئون 

يتم تنزیل مجموعة البیانات التي آستخدمها هنا لمهمة مراجعات TikTok‏ لتحلیل المشاعر من 
-Kaggle‏ تم جمعهاني الأصل من تقییمات TikTok‏ على متجر Google Play‏ يمكنك تنزیل 
مجموعة البیانات هذه من هنا. دعنا الآن نستورد مکتبات بایثون ومجموعة البیانات اللازمة لبدء 
هذه المهمة: 


import pandas as pd 

aesti marcaolorlio ان رس‎ as pibe 

from wordcloud import WordCloud, STOPWORDS, 
ImageColorGenerator 

import nltk 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
from nltk.corpus import stopwords 

import string 

import re 

nltk.download('stopwords') 

stemmer = nltk.SnowballStemmer ("english") 


cera = pil read esy تا‎ SM) 
print (data.head()) 


content score thumbsUpCount \ 


8 Good 5 8 
: 1 Awesome app! Too many people on it where it's ... 5 
4 2 Not bad 5 e 
4 3 It is good 2 8 
1 4 Very interesting app 5 e 
4 

reviewCreatedVersion at replyContent repliedAt 

e 23.8.4 2022-04-05 23:18:30 NaN NaN 
9 57 NaN 2022-04-05 23:18:21 NaN NaN 
20 23.9.5 2022-04-05 23:17:34 NaN NaN 
2 3 22.2.5 2022-04-05 23:17:04 NaN NaN 
3 4 22.1.5 2022-04-05 23:17:04 NaN NaN 
4 


فى الانطباعات (impressions)‏ الأولى لمجموعة البیانات هذه یمکننی رژية قيم خاليةفي yar‏ 
الأعمدة. لتحليل تقييمات TikTok‏ نحتاج فقط إلى عمودین. المحتوى (content)‏ والنتيجة 


تحليل المشاعر: عن طريق المثلة 


(ع:560)؛ لذلك دعونا Le‏ مجموعة بيانات جديدة مع هذين العمودين فقط ونتقدم خطوة 
آخری من خلال تحلیل TikTok «bf‏ 


data = data[["content", "score"] ] 
print (data.head()) 


content score 
Good 5 
Awesome app! Too many people on it where it's ... 


Not bad 


PWN © 


5 
5 
It is good 2 
Very interesting app 5 


bes‏ الآن نری ما ذا كان أي من هذین العمودین يحتوي على أي قيم فارغة: 
print (data.isnull().sum() )‏ 


content 4 
score e 


dtype: int64 
لذلك هناك آربع قیم فارغةفي عمود المحتوی. دعنا نسقط القیم الفارغة ونتحرك آبعد من ذلك:‎ 


data = data.dropna() 


دعنا OYI‏ نجهز هذه البیانات لمهمة تحلیل المشاعر. هنا يتعين Ule‏ تنظیف النصفي عمود 
المحتوی: 


stopword=set (stopwords.words('english") ) 
def clean (text): 


text = str(text).lowerQ 

tek =] AS )اناد‎ ۲ NDSSSENI VS VUL ieee) 

ایا را (meco #3 A NS Tnn N NS‏ تاه re‏ = اه 

text = ۳۵ .sub('’<,*?s+', '', text) 

text = re.sub('[$s]' 5 re.escape(string.punctuation), '', 
text) 

text = resale Wal, YY, debt) 

Exe = E Silo )' 4 Wee. VV. Teese) 

text = [word for word in text.split(' ') if word not in 
stopword] 

text-" ".join(text) 

text = [stemmer.stem(word) for word in text.split(' ')] 

text-" ".join(text) 


Deturm text 
data["content"] = data["content"].apply (clean) 


دعنا الآن نلقي نظرة على النسب المتوية للتقییمات الممنوحة ل TikTok‏ على متجر Google‏ 
iPlay‏ 


ratings = data["score"].value counts() 


تحلیل المشاعر لمراجعات TikTok‏ باستخدام بایئون 


6 6 6 16 ۰ 
مم 4d‏ لیا لھ 


numbers ratings.index 
quantity ratings.values 
import plotly.express as px 


figure = px.pie(data, 
values=quantity, 
names=numbers, hole 


99) 


figure.show() 


يمكنك أن تری أن 775.7 من المستخدمین قد أعطوا خمسة تقییمات ل TikTok‏ .5 712.1 
من المستخدمین صنفوها ب 1. الآن دعنا نلقي نظرة على نوع الکلمات التي یستخدمها 


:TikTok المستخدمون‌فی مراجعات‎ 
text = " ".join(i for i in data.content) 
stopwords = set (STOPWORDS) 
wordcloud = WordCloud(stopwords-stopwords, 


(text) 


background color-"white").generat 


plt.figure( figsize-(15,10)) 
plt.imshow(wordcloud, interpolation-'bilinear') 
jolie scias (( ETE) 
plt.show() 
Love tik = good good. "O bip 
good love LN i 2 
app great aah e, + 
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Teo اس‎ ium 
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“love tiktokgreat-app 


تحليل المشاعر: عن طريق المثلة 


سأضيف OW‏ ثلاثة أعمدة أخرىني مجموعة البيانات هذه على أنها إيجابية (Positive)‏ وسلبية 
(Negative)‏ ومحايدة (Neutral)‏ من خلال Che‏ درجات المشاعر ( sentiment‏ 
65 للتغريدات: 


bes‏ الآن نلقي نظرة على نوع الكلمات التي يستخدمها الناسفي التعليقات الإيجابية على 


:TikTok 
nltk.download('vader lexicon’) 
sentiments = SentimentIntensityAnalyzer () 
daralt Positive] = رکه یماصتعا‎ [Moos EOE 36 
in data["content"] ] 
data["Negative"] = [sentiments.polarity scores(i)["neg"] for i 
in data["content"] [ 
data ۲ Neutrals = او‎ SNES polarity scores (i) [mewn] form i 
in data["content"] | 
data = data[["content", "Positive", "Negative", "Neutral"]] 


print (data.head()) 


content Positive Negative ١ 


e good 1.000 e.e 

1 awesom app mani peopl easier fb girl awesom gu... 6.381 e.e 

2 bad 6.666 1.0 

3 good 1.000 6.6 

4 interest app 0.750 6.6 
Neutral 

e e.ee0 

1 0.619 

2 0.000 

3 6.666 

4 0.250 


دعنا الآن نلقي نظرة على نوع الکلمات التي یستخدمها الناس JOE‏ التعلیقات الايجابية على 
:TikTok‏ 


positive لاك‎ Y باتوی‎ EOC 3t wa 

data['content'] [data['Positive'] > data["Negative"]]]) 
stopwords = set (STOPWORDS) 

wordcloud = WordCloud(stopwords-stopwords, 

background _color="white") .generate (positive) 
plt.figure( figsize=(15,10) ) 

plt.imshow(wordcloud, interpolation-'bilinear') 

PEE وله‎ oft 

plt.show() 


تحلیل المشاعر لمراجعات TikTok‏ باستخدام بایئون 29 


e ار‎ Iove tiktok app -] lovegood good 
= app best 5 
love good 2 i 

8 think l 
S 599 60 fun, oe 0 
— od thing 
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دعنا الآن نلقي نظرة على نوع الکلمات التي یستخدمها الناس UU‏ التعلیقات السلبية على 
:TikTok‏ 


negative -' '.join([i for i in 
data['content'][data['Negative'] > data["Positive"]]]) 
stopwords = set (STOPWORDS) 

wordcloud = WordCloud(stopwords-stopwords, 

background _color="white") .generate (negative) 
plt.figure( figsize=(15,10) ) 

plt.imshow(wordcloud, interpolation-'bilinear') 
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هي الطريقة التي یمکننا بها تحلیل مشاعر مراجعات Tik Tok‏ باستخدام لغة برمجة بایشون. 


الملخص 
إذن هذه هي LAS‏ تحلیل مشاعر مراجعات TikTok‏ . تشتهر TikTok‏ بمقاطع الفیدیو 
القصيرة الخاصة بها. CU‏ ما یستخدم الأشخاص هذا التطبیق لمشاهدة مقاطع فیدیو مسلية 


تحليل المشاعر: عن طريق المثلة 


ومضحكة. على الرغم من محتواه الترفيهي, إلا أن هذا التطبيق لا يحبه الجميع. آمل أن تكون قد 
أحببت هذه المقالة حول تحليل مشاعر مراجعات TikTok‏ باستخدام بايثون. 


المصدر: 


https: //thecleverprogrammer.com/2022/04/12/tiktok-reviews- 


sentiment-analysis-using-python/ 


31 مشاعر حرب آوکرانیا وروسیا على تویتر باستخدام بایئون‎ Julai 


Julai (5‏ مشاعر حرب آوکرانیا وروسیا على تویتر باستخدام بایئون 
Ukraine Russia War Twitter Sentiment Analysis using Python‏ 
الیوم هو الیوم التاسع عشر للحرب بين روسیا وآوکرانیا. تدعم العدید من الدول آوکرانیا من 
خلال فرض عقوبات اقتصادية على روسیا. هناك الکثیر من التغریدات حول حرب أوكرانيا 
وروسیا حيث يميل الناس إلى تحدیث الحقائق على الأرض. وما یشعرون به حیال ذلك. ومن 
یدعمون. لذلك إذا كنت ترغب‌في تحلیل مشاعر الناس بشأن الحرب‌في أوكرانيا وروسياء فهذا 
المقال مناسب لك.ق هله المقالة. سأطلعك على مهمة تحلیل مشاعر الحرب‌في آوکرانیا وروسیا 


على تویتر باستخدام لغة بايثون. 


تحلیل معنویات حرب آوکرانیا وروسیا على تویتر باستخدام بایئون 

يتم تنزیل مجموعة البیانات التي أستخدمها لمهمة تحلیل المشاعر على oliy Twitter‏ حرب 
آوکرانیا وروسیا من .Kaggle‏ تم جمع مجموعة البیانات Gods‏ البداية من eus Twitter‏ 
تحديثها بانتظام. يمكنك تنزیل مجموعة البیانات هذه من هنا. دعنا OYI‏ نستورد مکتبات بایثون 
ومجموعة البیانات اللازمة للبدء بهذه المهمة: 


import pandas as pd 

import seaborn as sns 

import matplotlib.pyplot as plt 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
from wordcloud import WordCloud, STOPWORDS, 
ImageColorGenerator 

import nltk 

import re 

from nltk.corpus import stopwords 

import string 


data = pd.read csv) 


id conversation id created at date time \ 
0 +8 1.502266e+18 2022-03-12 06:03:14 UTC 3/12/2022 6:03:14 
1 1.502530e418 1.502530e«18 2022-03-12 06:03:14 UTC 3/12/2022 6:03:14 
2 1.502530e+18 1.50253@e+18 2022-03-12 06:03:13 UTC 3/12/2022 6:03:13 
3 1.502530e+18 1.502210e«18 2022-03-12 06:03:12 UTC 3/12/2022 6:03:12 
4 1.502530e+18 1.500440e-18 2022-03-12 06:03:12 UTC 3/12/2022 6:03:12 
timezone user id username \ 

0 2.019880e«07 redcelia 

0 2.275356e+08 eee eff 

0 8.431317e+07 mistify 007 


© ده سا > 


6 9.898620e+17 reallivinghuman 
0 1.164940e+18 rpcsas 


^ لي J‏ شاعر: عن طريق الا li‏ 


name place ... geo source user rt id ١ 


e Johnson Outua cumar Q9 5* #NeverVoteTory NaN ... NaN NaN NaN 

1 Wearing Masks still saves lives uamc Ëi » NaN ... NaN NaN NaN 

2 Brian: NaN ... NaN NaN NaN 

3 Basha  NaN ... NaN NaN NaN 

4 RonJon NaN ... NaN NaN NaN 
user_rt retweet_id reply_to \ 

e NaN NaN [i'screen name': 'RussianEmbassy', 'name': 'Ru... 

1 NaN NaN [1 

2 NaN NaN [1 

3 NaN NaN [('screen name': 'RussianEmbassy', 'name': ‘Ru... 

4 NaN NaN [('screen name': 'IsraeliPM', 'name': ‘Prime M... 
retweet date translate trans src trans dest 

e NaN NaN NaN NaN 

1 NaN NaN NaN NaN 

2 NaN NaN NaN NaN 

3 NaN NaN NaN NaN 

4 NaN NaN NaN NaN 


دعونا نلقي نظرة سريعة على جمیع أسماء الاعمدة لمجموعة البیانات: 
print (data.columns)‏ 


Index(['id', 'conversation id', 'created at', 'date', ‘time’, ‘timezone’, 
'user id', 'username', 'name', 'place', 'tweet', 'language', 'mentions', 
'urls', 'photos', 'replies count', 'retweets count', 'likes count', 
'hashtags', 'cashtags', 'link', 'retweet', 'quote url', 'video', 
'thumbnail', 'near', 'geo', 'source', 'user rt id', 'user rt', 
'retweet id', 'reply to', 'retweet date', 'translate', 'trans src', 
'trans dest'], 


dtypez'object') 
(tweet) والتخريدة‎ (username) نحتاج فقط إلى ثلاثة أعمدة لهذه المهمة (اسم المستخدم‎ 
سأختار فقط هذه الأعمدة وأمضى قدمًا:‎ ‘(anguage) واللغة‎ 
data = data[["username", "tweet", "language"]] 
دعنا نلقي نظرة على ما إذاكان أي من هذه الاعمدة يحتوي على أي قیم فارغة أم لا:‎ 
daram Snu )( SUM) 


username e 
tweet e 
language e 
dtype: int64 


لذلك لا يحتوي أي من الأعمدة على قیم فارغة» فلنلق نظرة سريعة على عدد التغریدات التي يتم 
لغة 


E 


data["language"].value counts(Q 


۳ لي D JI‏ اعر: عن طريق الا رت 33 


en 8812 
pt 251 
und 198 
it 155 
in 122 
ru 85 
hi 55 
ja 52 
es 49 
ta 23 
tr 19 
ca 18 
fr 16 
et 16 
tl 15 
nl 14 
de 13 
pl 13 
fi 9 
ar 9 
zh 9 
sv 6 
uk 6 
te 6 
mr 5 
cs 4 
el 4 
gu 4 
no 3 
th 3 
kn 3 
ro 3 
ur 2 
or 2 
eu 2 
ko 2 
ht 2 
sl 2 
bn 1 
cy 1 
ne 1 


Name: language, dtype: int64 
لذا فإن معظم التغریدات باللغة الانجليزية. دعنا نجهز هذه البیانات لمهمة تحلیل المشاعر. سأقوم‎ 
هنا بإزالة جمیع الروابط وعلامات الترقیم والرموز وأخطاء اللغة الأخرى من التغریدات:‎ 


nltk.download('stopwords') 
stemmer = nltk.SnowballStemmer ("english") 
stopword-set(stopwords.words('english')) 


def clean(text): 


text = str(text).lower(Q 

text = iS Sulo( IAL, UU, Eert) 

text = re.sub('https?://\St+|www\.\St', '', text) 
text -re sube Ps! UV, deeds) 


تحليل المشاعر: عن طريةاللمثلة 


text = re.sub('[$s]' 5 re.escape(string.punctuation), '', 
text) 

text = re. ERN Ne rM esca) 

text — re.sub('Nw*NdNw*', '', text) 

text = [word for word in text.split(' ') if word not in 
stopword] 

text-" ".join(text) 

text = [stemmer.stem(word) for word in text.split(' ')] 

text-" ".join(text) 

return text 
data["tweet"] = data["tweet"].apply (clean) 


Les‏ الآن نلقي نظرة على سحابة الکلمات i wordcloud)‏ التغریدات. والتي ستظهر الکلمات 
MI‏ کثر استخدامّاني التغریدات من قبل الأشخاص الذین یشارکون مشاعرهم والتحدیثات حول 
حرب آوکرانیا وروسیا: 


text = ۲ ".join(i for i in data.tweet) 
stopwords = set (STOPWORDS) 
wordcloud = WordCloud(stopwords-stopwords, 


background _color="white") .generate (text) 
plt.figure( figsize=(15,10) ) 
plt.imshow(wordcloud, interpolation-'bilinear') 
OEE SS OEE) 


plt.show() 
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سأضيف الان ثلاثة آعمدة أخرىفي مجموعة البیانات هذه على آنها إيجابية (Positive)‏ وسلبية 
(Negative)‏ ومحايدة (Neutral)‏ من خلال حساب درجات المشاعر ) sentiment‏ 
65 للتغریدات: 


۲ 8 7 


nltk.download('vader lexicon") 
sentiments = SentimentIntensityAnalyzer() 


lence || Virose! | = رز هه وروی روا‎ | OOS EOE a 

in data["tweet"] [ 

data["Negative"] = [sentiments.polarity scores(i)["neg"] for i 
] 


] 


in data["tweet" 


35 تحلیل المشاعر: عن طريق الامثلة‎ 
data["Neutral"] = [sentiments.polarity scores(i)["neu"] for i 


in data["tweet"]] 
data = data[["tweet", "Positive", "Negative", "Neutral"]] 
print (data.head()) 


tweet Positive Negative \ 


6 russianembassi ft mfarussia jeffdsach csdcolum... 0.077 0.284 

1 kidnap without charg access lawyer putin russi... 0.000 0.000 

2 much western civil everyon feel compel find cr... 0.144 0.259 

3 russianembassi love place ill visit sure next ... @.291 0.126 

4 israelipm iaeaorg didnt know state israel advi... 0.000 0.000 
Neutral 

e 6.639 

1 1.000 

2 @.596 

3 0.583 

4 1.000 


bes‏ الآن نلقی نظرة على الکلمات الأكثر شیوغٌا التى يستخدمها الأشخاص ذوو المشاعر 
الإيجابية: 


positive = '.join([i for i in data['tweet'][data['Positive'] 
» data["Negative"]]]) 

stopwords = set (STOPWORDS) 

wordcloud = WordCloud(stopwords-stopwords, 

background _color="white") .generate (positive) 

plt.figure( figsize=(15,10) ) 

plt.imshow(wordcloud, interpolation='bilinear') 

OIE sexus AOE y 


plt.show() 


owant ol iva » : zio 
c-na Fd al Ee 
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CT = fue sorri sanction® i 7 
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" back" = war Du i iw makeis 


1 
"russian Jone 
wor 1d supporti UTI None 


bes‏ الآن نلقی نظرة على الکلمات الا کثر شیوعا التی یستخدمها الأشخاص ذوو المشاعر السلبية: 


negative -' '.join([i for i in data['tweet'][data['Negative'] 
» data["Positive"]]]) 
stopwords = set (STOPWORDS) 


۳ لب J‏ شاعر: عن طريق الا li‏ 


wordcloud = WordCloud(stopwords-stopwords, 
background _color="white") .generate (negative) 
plt.figure( figsize=(15,10) ) 
plt.imshow(wordcloud, interpolation-'bilinear') 
عفدم‎ easi (Suede 


plt.show() 

Iw ra america © 575077 need C nust 
peo +sti 11 Nl 
wen er mi 8 : c —- = (Uic. 
let „Mi itari ukrain war d ۲ | 

a ato ‘ukrainbiden e fighter q a Te 
Á a mean oO WY) 
£ 4 2 2 
S even س‎ ts JO 
side think T live ا‎ J 
pe potus put i orl ain [oec amp: 

oar 80: one a ares war MER 
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هذه هي الطريقة ة التي یمکنك بها تحليل مشاعر الناس بشان حرب أوكرانيا وروسیا. آمل أن تنتهي 

هذه الحرب G‏ وأن تعود الأمور إلى طبيعتها 

الملخص 

هناك الكثير من التغريدات حول حرب أوكرانيا وروسيا حيث يميل الناس إلى تحديث الحقائق 
على الأرض. وما يشعرون به حيال ذلك. ومن يدعمون. لقد استخدمت هذه التغريداتفي مهمة 
تحليل المشاعر على تويتر بشأن حرب أوكرانيا وروسيا. 


المصدر: 


https://thecleverprogrammer.com/2022/03/15/ukraine-russia-war- 


[twitter-sentiment-analysis-using-python 


تحلیل مشاعر مراجعات Flipkart‏ باستخدام بایئون 7 


oD 


Flipkart باستخدام بایئون‎ Flipkart مشاعر مراجعات‎ Julai 6 
Reviews Sentiment Analysis using Python 

Flipkart‏ هي واحدة من آشهر الشرکات الهندية. إنها منصة للتجارة الالکترونية تتنافس مع 
منصات التجارة الإلكترونية الشهيرة مثل Amazon‏ واحدة من آکثر حالات استخدام ele‏ 
البیانات شيوعًا هي مهمة تحلیل المشاعر لمراجعات المنتجات المباعة على منصات التجارة 
الالکترونية. لذلك. إذا كنت ترید معرفة كيفية تحلیل مشاعر مراجعات Flipkart‏ فهذه المقالة 
مناسبة لك. في هذه المقالق سوف آطلعك على مهمة Flipkart‏ لمراجعة تحلیل المشاعر 
باستخدام بايثون. 


Julai‏ مشاعر مراجعات Flipkart‏ باستخدام بایئون 
يتم تنزيل مجموعة البيانات التي i‏ ستخدمها هنا dee‏ المشاعر لمراجعات Flipkart‏ من 
.Kaggle‏ لنبداً هذه المهمة عن طريق استيراد مكتيات بايثون ومجموعة البيانات الضرورية: 


import pandas as pd 

import seaborn as sns 

import matplotlib.pyplot as plt 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
from wordcloud import WordCloud, STOPWORDS, 
ImageColorGenerator 


data = 

pd.read csv("https://raw.githubusercontent.com/amankharwal/Web 
site-data/master/flipkart reviews.csv") 

print (data.head()) 


Product name ... Rating 
Lenovo Ideapad Gaming 3 Ryzen 5 Hexa Core 5600... ... 5 
Lenovo Ideapad Gaming 3 Ryzen 5 Hexa Core 5600... 
Lenovo Ideapad Gaming 3 Ryzen 5 Hexa Core 5600... 
DELL Inspiron Athlon Dual Core 3050U - (4 GB/2... 
DELL Inspiron Athlon Dual Core 3050U - (4 GB/2... 


^ wn PrP © 
uuu uw 


[5 rows x 3 columns] 


تحتوي مجموعة البیانات هذه على BYE‏ آعمدة فقط. دعنا نلقي نظرة على ما إذا كان أي من هذه 
الأعمدة يحتوي على قیم مفقودة أم لا: 
print (data.isnull().sum() )‏ 


Product_name e 
Review e 
Rating e 
dtype: int64 


تحليل المشاعر: عن طريق المثلة 


لذلك لا تحتوي مجموعة نظرًا لآن هذه هي مهمة تحليل المشاعر 
لمراجعات Flipkart‏ ۰ فسوف آقوم بت بتنظيف واعداد العمود الذي يحتوي على المراجعات قبل 
التوجه إلى تحلیل المشاعر 


import nltk 

import re 

nltk.download('stopwords') 

stemmer = nltk.SnowballStemmer ("english") 
from nltk.corpus import stopwords 

import string 

stopword=set (stopwords.words('english") ) 


def clean(text): 


text = str(text).lower() 

vede = ECSU ONIN UU. wesc) 

text = re.sub('https?: INS NEE, VUL EEKE) 

teda = Be sulo(’<, "Fert, "UL ex 

text = re.sub('[$s]' 5 re.escape(string.punctuation), '', 
text) 

CMe exeo Val, YU, que) 

OE = re Silo Wee Wels. VV. exe) 

text = [word for word in text.split(' ') if word not in 
stopword] 

text-" ".join(text) 

text = [stemmer.stem(word) for word in text.split(' ')] 

text-" ".join(text) 

Deburmn ext 
data["Review"] = data["Review"].apply (clean) 


تحلیل المشاعر FlipkartcjLeal oJ‏ 
يحتوي عمود التصنیف (Rating column)‏ الخاص بالبیانات على التصنیفات التي قدمها کل 
مراجع. لذلك دعونا نلقي نظرة على كيفية قيام معظم الاشخاص بتقییم المنتجات التي یشترونها 

: Flipkart من‎ 


ratings = data["Rating"].value counts() 


numbers = ratings.index 
quantity = ratings.values 


import plotly.express as px 
figure = px.pie(data, 
values=quantity, 
names=numbers,hole = 0.5) 
figure. show() 


تحليل مشاعر مراجعات Flipkart‏ باستخدام بایئون 56 


لذلك منح 60 / من المراجعين 5 من صل 5 تقييمات للمنتجات التي يشترونها من Flipkart‏ 
دعونا الآن نلقي نظرة على نوع التعليقات التي يتركها الأشخاص. لهذاء سأستخدم سحابة 
الكلمات (word cloud)‏ لتصوير الكلمات الأكثر استخدامّافي عمود المراجعات : 


text = " ".join(i for i in data.Review) 

stopwords = set (STOPWORDS) 

wordcloud = WordCloud(stopwords=stopwords و‎ 
background_color="white") .generate (text( 


plt.figure( figsize=(15,10) ) 
plt.imshow(wordcloud, interpolation-'bilinear') 


pilt axis (Horr) 
plt.show( 
ch need qualità 529200 و‎ T ea t 
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سأقوم الآن بتحلیل مشاعر مراجعات Flipkart‏ عن طریق اضافة BE‏ أعمدةفي مجموعة البیانات 

هذه على آنها إيجابية (Positive)‏ وسلبية (Negative)‏ ومحايدة (Neutral)‏ من خلال 
حساب درجات المشاعر (sentiment scores)‏ للمراجعات: 

nltk.download('vader lexicon") 

sentiments = SentimentIntensityAnalyzer() 


09-9۳۲ 9ص اتسوا = اوه تون‎ SCOSS CH | SOSIN or 
in data["Review"] ] 


تحليل المشاعر: عن طريقالاعثلة 


data["Negative"] = [sentiments.polarity scores(i)["neg"] for i 
in data["Review"] ] 
data["Neutral"] = 
in data["Review"] ] 
data = data[["Review", "Positive", "Negative", "Neutral"] ] 
print (data.head()) 


[[senuesiimeneseoolltammtya SEOEES (cis) Ene EOE 


Review ... Neutral 
@ best great performancei got around backup bi... ... 0.504 
T good perfom ... 0.256 
2 great perform usual also game laptop issu batt... ... 0.723 
3 wife happi best product ۳ 0.488 
4 light weight laptop new amaz featur batteri li... ... 1.000 


[5 rows x 4 columns] 


:Flipkart دعونا نری كيف يفكر معظم المراجعین‌في منتجات وخدمات‎ oM 


x = sum(data["Positive"]) 
y = sum(data["Negative"]) 
z = sum(data["Neutral"]) 


der SeneimenmtE score (a, O, Ch 
if (a>b) and (a>c): 
print ("Positive © ") 
elif (b>a) and (b>c): 
print ("Negative ") 
else: 


print ("Neutral S E 
sentiment score(x, y, z) 


Neutral & 


لذا فإن معظم المراجعات محايدة. دعنا نلقي نظرة على إجمالي درجات المشاعر الايجابية 
والسلبية والحيادية للعثور على نتيجة حول مراجعات Flipkart‏ : 


icine (LESSEE ی‎ se) 
print("Negative: ", y) 
prime (Nevie cela رت‎ vay 


Positive: 923.5529999999985 
Negative: 13 
Neutral: 1283 6 


تحلیل مشاعر مراجعات Flipkart‏ باستخدام بایئون 
الملخص 
لذلك» يعطي معظم الأشخاص مراجعات محايدة وتقدم نسبة صغيرة من الأشخاص مراجعات 
سلبية. لذلك یمکننا القول إن الناس راضون عن منتجات وخدمات Flipkart‏ آمل أن تکون قد 
أحببت هذا المقال حول تحلیل المشاعر Flipkart J‏ باستخدام بایشون. 


المصدر: 


https: //thecleverprogrammer.com/2022/02/15/flipkart-reviews- 
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تحلیل المشاعر تجاه لقاع فایزر باستخدام بایئون 42 


7( تحلیل المشاعر تجاه لقاح فایزر باستخدام بایئون Pfizer Vaccine‏ 
Sentiment Analysis using Python‏ 

يعد Twitter‏ أحد آکثر تطبیقات الوسائط الاجتماعية شيوعًا حيث یتمتع الأشخاص بحرية 
مشاركة آرائهم حول أي موضوع. هناك العدید من التغریدات المسجلة حول التوعية بلقاح فایزر 
(Pfizer vaccine)‏ والتي يمكن استخدامها لتحليل مشاعر الناس حول لقاح فایزر. لذلك. إذا 
كنت ترید معرفة كيفية استخدام مجموعة بیانات Twitter‏ لتحلیل المشاعر فهذه المقالة مناسبة 
لك.في هذه المقالة. سوف آطلعك على مهمة تحلیل المشاعر تجاه CW‏ فایزر باستخدام بایشون. 


Julai‏ المشاعر تجاه elö‏ فایزر باستخدام بایئون 

تم تتزیل مجموعة البانات التي ستخدمها لمهمة تحلیلالمشاعر تجاه لاح فایزر من 162016 
والتي تم جمعهاني البداية من Twitter‏ عندما كان الأشخاص یشارکون آرائهم حول CW‏ فایزر. 
لنبدأ مهمة تحلیل المشاعر تجاه لقاح Pfizer‏ عن طریق استیراد مکتبات بايثون ومجموعة 
البیانات اللازمة: 


import pandas as pd 

import seaborn as sns 

import matplotlib.pyplot as plt 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
from wordcloud import WordCloud, STOPWORDS, 
ImageColorGenerator 


data = 

pd.read csv("https://raw.githubusercontent.com/amankharwal/Web 
site-data/master/vaccination tweets.csv") 

print (data.head()) 


id user name ... favorites is retweet 
0 +6 Rachel Roh ... e False 
1 33 Albert Fong ... 1 False 
2 3 elitreu ... 8 False 
31 7 Charles Adler ... 2129 False 
4 1337854064604966912 Citizen News Channel ... e False 


[5 rows x 16 columns] 


لذا فإن مجموعة البیانات هذه كبيرة e‏ دعنا نلقي نظرة على ما إذا كانت تحتوي على أي قيم 


data.isnull().sumQ 


تحلیل المشاعر: عن طريق الامثلة 


id 

user_name 
user_location 
user_description 
user_created 
user_followers 
user_friends 
user_favourites 
user_verified 
date 

text 

hashtags 

source 

retweets 
favorites 
is_retweet 


dtype: int64 


على الرغم من أن هذه القیم الخالية لن تؤثر على مهمة تحلیل المشاعرء للحفاظ على بساطة 
الأمور» سأقوم بإسقاط الصفوف التي تحتوي على قيم خالية OY‏ مجموعة البیانات كبيرة بالفعل: 


data = data.dropna() 


id user followers ... retweets favorites 
count 4.749000e«03 4.749000e«03 ... 4749.000000 4749.000000 
mean 1.355333e+18 5.069683e+04 ... 1.545378 9.385555 
std 1.280104e+16 3.545446e+05 ۰ 13.395572 55.280915 
min 1+8 6.66666 +99 ... 6. 666666 6. 06660666 
25% 1.344929e+18 1.740000e«02 ... 6. 066666 6. 000666 
50% 1.352030e418 6.480000e«402 ... 0.000000 1.000000 
75% 1.364940e+18 2.728000e+03 ... 1.000000 5.000000 
max 1.384788e+18 1.371493e+07 ... 678.000000 0 


[8 rows x 6 columns] 


يعد عمود النص (text column)‏ آهم is‏ مجموعة البیانات هذه BY‏ يحتوي على آراء 
مستخدمي Twitter‏ حول لقاح فایزر .لکن يجب إعداد عمود النص OY‏ يحتوي على العدید 
من الرموز الخاصة والأخطاء اللغوية. فیما يل ىكيف یمکننا تنظيف عمود النص: 


text) 


r 


impose Milek 


import re 


nltk.download('stopwords') 

stemmer = nltk.SnowballStemmer ("english") 
from nltk.corpus import stopwords 

import string 
stopword-set(stopwords.words('english')) 


def clean(text): 


< str(text).lower() 


26 SUD اه توا‎ VL مت‎ wes) 
re.sub('https?://\St+|www\.\St+', 


= ie, slo ("<n ExpL VUL 6 


Cex 
۱۳ 
2 
text 


op lo تحليل المشاعر‎ 


text = re.sub('[$s]' 5 re.escape(string.punctuation), '', 
text) 

text = re.sub('\n', '', text) 

text = re.sub('Nw*NdNw*', '', text) 

text = [word for word in text.split(' ') if word not in 
stopword] 

text=" ". join (text) 

text = [stemmer.stem(word) for word in text.split(' ')] 

text-" ".join(text) 

Peturm text 
data["text"] = data["text"].apply (clean) 


coy‏ دعنا نلقي نظرة على سحابة الکلمات (word cloud)‏ عمود النص. سحابة الکلمات 
هی تقنية تصوير البیانات تعرض الکلمات الأكثر استخدامًا بخط کبیر والکلمات BY‏ استخدامًا 


eras = U ۳۰. OT 1 روط‎ GL akin 252ل‎ IEEE) 

stopwords = set (STOPWORDS) 

wordcloud = WordCloud(stopwords-stopwords, 
background _color="white") .generate (text) 
plt.figure( figsize=(15,10) ) 
plt.imshow(wordcloud, interpolation-'bilinear') 
jou peat si (Meese) 

plt.show() 
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second. dose," covidvaccin side ef 
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1 ad. 


tart 


pfizerbiontech vaccin- 


ovidvaccin pfizerbiontech 
grate 


meld Tarek first dose 
gova vaccin hie DUE One, 


bes‏ الآن نلقي نظرة على سحابة الكلماتفي عمود الوسوم (hashtags column)‏ والتي یمکن 
أن توضح نوع الوسوم التي كانت رائجة عندما كان الأشخاص یشارکون آرائهم حول لقاح فایزر: 


text = ۲ ".join(i for i in data.hashtags) 
stopwords = set (STOPWORDS) 

wordcloud = WordCloud(stopwords-stopwords, 
background _color="white") .generate (text) 
plt.figure( figsize=(15,10) ) 
plt.imshow(wordcloud, interpolation-'bilinear') 
ORE SS SEO EE) 

plt.show() 


۳ لي a JI‏ اعر: عن طريق الا li‏ 


coronavirus' 
vaccine" 
Pfizer" ۱ 


PfizerBioNTech' vaccine J 


PfizerBioNTech' PfizerBioNTech js 


PfizerBioNTech' CovidVaccine' 


RfizerBioNTech*. 
COV IDIZ سس ها‎ 


۳ یی‎ PfizerBioNTech' 


„ebt‏ عمود (user verified)‏ في مجموعة البیانات ما IS]‏ كان قد تم التحقق من المستخدمین 
الذین شارکوا آرائهم بواسطة Twitter‏ أم لا. المستخدم الموثق على Twitter‏ هو شخصية isle‏ 
أو شخصية مشهورة. لذلك دعونا نلقي نظرة على عدد المستخدمین الذین تم التحقق منهم 
والذین شارکوا آرائهم حول لقاح فایزر: 

data["user verified"].value_counts() 


False 4169 
True 580 


Name: user_verified, dtype: int64 


في الإخراج آعلاه يُظهر False‏ عدد المستخدمین الذين لم يتم التحقق منهم ویظهر True‏ عدد 
المستخدمين الذين تم التحقق منهم. دعنا الآن ننتقل إلى مهمة تحليل المشاعر للقاح فايزر. 
سأضيف هنا ثلاثة أعمدة آخری‌في مجموعة البيانات هذه على أنها موجبة (Positive)‏ وسلبية 
(Negative)‏ ومحايدة (Neutral)‏ من خلال حساب درجات المشاعرفي عمود النص: 


nltk.download('vader lexicon’) 
sentiments = SentimentIntensityAnalyzer () 


daa EOS HEI ve = مهو‎ Polarity xeretoserexe (i) OOS هط‎ at 
in data["text"] ] 

data["Negative"] = [sentiments.polarity scores(i)["neg"] for i 
in data["text"] ] 

EOE ab‏ لا هی از Newel || = [sentinents Polarity SCEOLES (aL)‏ ] مداه 


in data [eres M TT 
data = data[["text", "Positive", "Negative", "Neutral"]] 
print (data.head()) 


text ... Neutral 
e folk said daikon past could treat cytokin stor... ... 0.748 
2 coronavirus sputnikv astrazeneca pfizerbiontec... ... 1.000 
6 bit sad claim fame success vaccin patriot comp... ... 0.481 
9 covidvaccin state start get monday us say pak... ... 1.000 
10 death close mark million peopl wait pfizerbio... ... 0.698 


[5 rows x 4 columns] 


حل 
ol‏ 


تحليل المشاعر تجاه لقاع ji‏ باستخدام بايثون 


الآن دعونا نحسب شعور معظم الناس تجاه لقاح فايزر: 


sum (data["Positive"]) 
sum (data["Negative"]) 
sum (data["Neutral"]) 


NK 
۱ | og 


def sentinent Geom (a, Io, (Gs 
af (a>b) and (a>c); 
print ("Positive © ") 
elif (b>a) and (b>c): 
print ("Negative WD) 
else: 
print ("Neutral © 3) 
sentiment score(x, y, z) 


Neutral © 


لذلك كانت معظم آراء المستخدمين محايدة. دعنا Ab‏ نظرة على إجمالي كل نتيجة عاطفية قبل 
التوصل إلى أي استنتاج: 


عد (LESSEE UL‏ ل طم 
print("Negative: ", y)‏ 
(Seve cela Wo wa‏ 19222110 


Positive: 417.81600000000003 
Negative: 188.81200000000024 
Neutral:  4142.3750000000055 


مجموع الایجابیات والسلبیات آقل بکثیر من الحياديةء لذلك یمکننا القول إن مناقشة مستخدمي 
تویتر كانت حول الوعي بلقاح فایزر بدلاً من مشاركة فوائده أو عیوبه. 

الملخص 

هذه هي الطريقة التي يمكنك بها تحلیل آراء مستخدمي تویتر حول لقاح فايزر.في ختام تحلیل 
المشاعر هذاء يمكنني القول فقط إن مناقشة مستخدمي تویتر كانت حول الوعي بلقاح فایزر بدلاً 
من مشاركة فوائده أو عیوبه. آمل أن تکون قد آحببت هذا المقال حول تحلیل المشاعر تجاه لقاح 
فایزر باستخدام بایشون. 


المصدر: 


https://thecleverprogrammer.com/2021/10/12/pfizer—-vaccine- 
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تحلیل المشاعر تجاه متحور Omicron‏ باستخدام بایئون 


Juni (8‏ المشاعر تجاه متحور Omicron‏ باستخدام بایئون 
Omicron Sentiment Analysis using Python‏ 

قبل أيام AL‏ صنفت منظمة الصحة العالمية Gy‏ جدیدا من الفیروس التاجي 
(coronavirus)‏ ۰1.1.1.529 کمتحور مثير للقلق أطلق عليه اسم .Omicron‏ بعد ذلك 
مباشرة. رأينا انتشار التغريدات حول متحور Omicron‏ على Twitter‏ . لذاء إذاكنت تريد معرفة 
كيف یمکننا تحليل مشاعر التغريدات حول متحور «Omicron‏ فهذه المقالة مناسبة لك.في هذه 
المقالةه سوف أطلعك على مهمة تحليل مشاعر Omicron‏ باستخدام بايثون. 


تحليل المشاعر لمتحور Omicron‏ باستخدام بايثون 

.Kaggle من‎ Omicron تنزيل مجموعة البيانات التي أستخدمها لمهمة تحليل مشاعر‎ e 
عندما كان الأشخاص یشارکون آرائهم حول متحور‎ Twitter والتي تم جمعهاني البداية من‎ 
عن طریق استیراد مکتبات بایثون‎ Omicron مهمة تحلیل المشاعر‎ junk .Omicron 


ومجموعة البیانات الضروریة: 


import pandas as pd 
import seaborn as sns 


import matplotlib.pyplot as plt 


from nltk.sentiment.vader import SentimentIntensityAnalyzer 
from wordcloud import WordCloud, STOPWORDS, 


favorites is retweet 


False 
False 
False 
False 


False 


2 


e 


e 
1 
e 


ImageColorGenerator 


data = pd.read csv("omicron.csv") 


print (data.head()) 


id user name ... 
60 1465693385088323591 Abaris ... 
1 1465693062999412746 GFTs B... 
2 1465690116442279942 Herbie Finkle (Cozy) ... 
3 1465689607165591552 Electrical Review ... 
4 1465688203709464578 BingX Academy .^ 


[5 rows x 16 columns] 


مجموعة البیانات هذه كبيرة جدا. دعنا نلقي نظرة على ما إذا كانت مجموعة البیانات هذه تحتوي 


على أي قيم فارغة أم لا: 


print (data.isnull().sum() ( 


- لي JI‏ ^ اعر: عن طريق الا li‏ 


id e 
user name e 
user location 4438 
user description 1278 
user created 

user followers 


user friends 


e 

e 

e 
user favourites e 
user verified e 
date e 
text e 
hashtags 4374 
source 
retweets e 
favorites e 
is retweet e 


dtype: int64 


تحتوي مجموعة البیانات على قیم خاليةفي ثلائة آعمدة تحتوي على بیانات نصية. وسأقوم بإزالة 
جمیع الصفوف التي تحتوي على القیم الخالية : 


data = data.dropna() 


تحلیل المشاعر لمتحور Omicron‏ 

يحتوي عمود النص (text column)‏ مجموعة البیانات على التغریدات التي eB‏ بها 
الأشخاص لمشاركة آرائهم حول متحور Omicron‏ .للمضي Gs‏ نحتاج إلى تنظیف هذا 
العمود وإعداده لمهمة تحليل المشاعر. إليك كيف يمكننا القيام بذلك: 


import 1 

import re 

nltk.download('stopwords') 

stemmer = nltk.SnowballStemmer ("english") 
from nltk.corpus import stopwords 

import string 
stopword-set(stopwords.words('english')) 


def clean(text): 


text = str (text) .lower() 

cern = rer sub (UN pass EN Ur UU, EY) 

text = re.sub('https?://NSt|wwwN.NSt', '', text) 

Lext = re.sub("<,*?>+', '', text) 

text = re.sub('[$s]' 5 re.escape(string.punctuation), '', 
text) 

cere, = re SuD Was, VUL wesc) 

text = re.sub('Nw*NdNw*', '', text) 

text = [word for word in text.split(' ') if word not in 
stopword] 

text-" ".join(text) 

text = [stemmer.stem(word) for word in text.split(' ')] 

text-" ".join(text) 


return text 
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data["text"] = data["text"].apply (clean) 
(word cloud) نظرة على سحابة الکلمات‎ OW نظرًا لأننا قمنا بتنظیف عمود النص. فلنلق‎ 
عمود النص لنلقي نظرة على آکبر عدد من الکلمات التي یستخدمها الأشخاص في تغریداتهم:‎ 


ieee c 0 OLO EOE 223ل‎ eerie) 

stopwords = set (STOPWORDS) 

wordcloud = WordCloud(stopwords-stopwords, 
background _color="white") .generate (text) 
plt.figure( figsize=(15,10) ) 
plt.imshow(wordcloud, interpolation-'bilinear') 
عفدم‎ ARTS LORE) 

plt.showQ 


omtcFons Varianta 


v today Say- “south africa™.;new variant 
go southafrica case 0111: ron. need 
elta omicronvari. us- usd 
- inc ia. * 01111 6۲0۲۲ omicron, 


vaccin gkn"omicron-case 


first:casejC case detect? tWo- Case. 
travel ** ate; eomicron omicronvari 


ES LOMECE ORE 


coyid variant world firs ron omicronvari ۴‏ 
دعنا الآن نلقي نظرة على سحابة الكلماتفي عمود الوسوم (hashtags column)‏ لالقاء نظرة 
على آکبر عدد من علامات التصنیف التي یستخدمها الأشخاص في تغريداتهم: 


text = ۲ ".join(i for i in data.hashtags) 
stopwords = set (STOPWORDS) 

wordcloud = WordCloud(stopwords-stopwords, 
background color-"white").generate (text) 
plt.figure( figsize-(15,10)) 
plt.imshow(wordcloud, interpolation-'bilinear') 
jolie هه‎ ETE 

plt.show() 


mecca 


time x 


Delta’ a سه سد‎ 


ON COVID19‏ کر 
Omicron' OmicronVariant' ۳‏ 


: Omicron' OmicronVarient’ 
: à SouthAfrica" 


"= omicron- Omicron'-— 
wm a OnicronVariant', india Ms ۱ 


| 01/1019 - Onicron' 


coronavirus' ži : safe 


„Karnataka he Covid' 
ancer’ variant’ » BREAKING br 


onVarient 
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تحليل المشاعر: عن طريق ato‏ 


الآن سأحسب درجات المشاعر للتغريدات حول متحور Omicron‏ سأضيف هنا ثلاثة أعمدة 
أخرىفي مجموعة البيانات هذه على أنها موجبة (Positive)‏ وسلبية (Negative)‏ ومحايدة 
(Neutral)‏ من خلال حساب درجات المشاعر (sentiment scores)‏ عمود النص: 


nltk.download('vader lexicon") 
sentiments = SentimentIntensityAnalyzer() 


cera موی‎ || Sl SERE MEMES POL AEE sreroraeys) (a1) [Mores Eo ab 
in data["text"]] 

data["Negative"] = [sentiments.polarity scores(i)["neg"] for i 
in data["text"]] 

data["Neutral"] = [sentiments.polarity scores(i)["neu"] for i 


in data["text"]] 
data < data[["text", "Positive", "Negative", "Neutral"]] 
print (data.head()) 


text Positive Negative Neutral 


6 skynew told id back omicron "odium medicum ins... 6.16 6.000 6.846 
1 someon told octob omicron 6.66 6.666 1.000 
3 autom system becom increas complex effort test... 6.66 6.000 1.000 
5 digitaldisrupt emerg technolog stay privat inv... 6.66 6.66 1.000 
7 fatigu head bodi ach occasion sore throat coug... e.ee 6.172 0.828 


الآن دعونا نری كيف كان رد فعل معظم الناس حول متحور Omicron‏ : 


x = sum(data["Positive"]) 
y = sum(data["Negative"]) 
z = sum(data["Neutral"]) 


def sentinent Sierras (el, Io, COE 
if (a>b) and (a>c): 
print ("Positive @ "y 
elif (b>a) and (b>c): 


print ("Negative 3) 
else: 


print("Neutral © "mn 
sentiment score(x, y, z) 


Neutral © 


لذلك كانت معظم الاراء محايدة. مما يعني أن الأشخاص کانوا یشارکون معلومات حول متغیر 
Omicron‏ بدلاً من مشاركة أي آراء ايجابية أو سلبية. 


تحلیل المشاعر تجاه متحور Omicron‏ باستخدام بایئون 1 


ol 


الملخص 

إذن هذه هي الطريقة التي يمكنك بها تحلیل مشاعر متحور Omicron‏ لفیروس کورونا. إنه نوع 
جدید من الفیروسات التاجية التي تم تصنیفها على آنها البدیل المثیر GLU‏ من قبل منظمة الصحة 
العالمية. آمل أن تكون قد أحبيت هذا المقال حول تحلیل المشاعر Omicron‏ باستخدام بايثون. 


المصدر: 


https://thecleverprogrammer.com/2021/12/06/omicron-sentiment- 
analysis-using-python/ 


C1 
N 


تحلیل المشاعر على Twitter‏ باستخدام بایئون 


Twitter باستخدام بایئون‎ Twitter تحلیل المشاعر على‎ (9 
Sentiment Analysis using Python 

Twitter‏ هو آحد منصات التواصل الاجتماعي حيث یتمتع الأشخاص بحرية مشاركة آرائهم 
حول أي موضوع. نری أحيانًا مناقشة قوية على Twitter‏ حول رأي شخص ما تؤدي آحیانا إلى 
مجموعة من التغریدات السلبية. مع وضع ذلكفي الاعتبان إذاكنت ترید معرفة كيفية إجراء تحلیل 
المشاعر (sentiment analysis)‏ على «Twitter‏ فهذه المقالة مناسبة لك.في هذه المقالة 
سوف آطلعك على مهمة تحلیل المشاعر على Twitter‏ باستخدام بایشون. 


تحلیل المشاعر على Twitter‏ 

تحلیل المشاعر مهمة معالجة اللغة الطبيعية (natural language processing)‏ يجب على 
جمیع منصات وسائل التواصل الاجتماعي مراقبة مشاعر المشاركينفي المناقشة. نری‌في الغالب 
آراء سلبية على تویتر عندما تکون المناقشة سياسية. لذلك. يجب أن تستمر کل منصةفي تحلیل 
المشاعر للعثور على نوع الأشخاص الذین ینشرون الكراهية والسلبية على نظامهم الأساسي. 


بالنسبة لمهمة تحلیل المشاعر على Twitter‏ قمت بجمع مجموعة بیانات من Kaggle‏ تحتوي 
على تغريدات حول مناقشة db gh‏ داخل مجموعة من المستخدمین. مهمتنا هنا هی تحدید عدد 
التغريدات السلبية والايجابية حتی نتمکن من إعطاء نتيجة. لذلك.في القسم ad‏ سأقدم لك 
مهمة تحلیل المشاعر على Twitter‏ باستخدام بايثون. 


تحلیل المشاعر على Twitter‏ باستخدام بایئون 
لنبداً مهمة تحلیل المشاعر على Twitter‏ من خلال استیراد مکتبات بایشون ومجموعة البيانات 
اللازمة: 


import pandas as pd 

import numpy as np 

from sklearn.feature extraction.text import CountVectorizer 
from sklearn.model selection import train test split 

from sklearn.tree import DecisionTreeClassifier 

import re 

import nltk 

MOCO E REG 


data = 

pd.read csv("https://raw.githubusercontent.com/amankharwal/Web 
site-data/master/twitter.csv") 

print (data.head()) 


52 تحلیل المشاعر: عن طريق الامثلة‎ 
Unnamed: @ count hate_speech offensive_language neither class ١ 

8 8 3 e e 3 2 

I 1 3 e 3 1 

2 2 3 e 3 e 1 

3 3 3 e 2 1 1 

4 4 6 e 6 e 1 
tweet 

0 !!! RT @mayasolovely: As a woman you shouldn't... 

1 !!!!! RT Gmleewl7: boy dats cold...tyga dwn ba... 

2 ۲۱۲۱۲۲ RT @UrKindOfBrand Dawg!!!! RT @8@sbaby 

3 !!!!!!!!! RT QC G Anderson: Gviva based she lo 

4 !!!!!!!!!!!!! RT @ShenikaRoberts: The shit you 


يحتوي عمود التغريدة de pores (tweet column)‏ البیانات آعلاه على التغریدات التي نحتاج 

إلى استخدامها لتحلیل مشاعر المشاركينفي المناقشة. ولکن للمضی G‏ يتعين Ue‏ تنظیف 

الکثیر من الأخطاء والرموز الخاصة الأخرى OV‏ هذه التغریدات تحتوي على الکثیر من الأخطاء 
اللغوية. إذن ELS!‏ كيف یمکننا تنظیف عمود التغریدة: 

nltk.download('stopwords') 

stemmer = nltk.SnowballStemmer ("english") 

from nltk.corpus import stopwords 


import string 
stopword-set(stopwords.words('english')) 


def Cue cH 


text = str(text).lower() 

EOS = 26 )هانگ‎ Nace XUL V9. CED 

Fe alol ۳ NE TI. NE, UUL ESE)‏ < ارت 

CEE = EFE نات‎ GS. VUL Cex) 

text = re.sub('[$s]' 5 re.escape(string.punctuation), '', 
text) 

text = re.sub('\n', '', text) 

EEE < rensub( WM NOEL, ۰۲۱ text) 

text = [word for word in text.split(' ') if word not in 
stopword] 

text-" ".join(text) 

text = [stemmer.stem(word) for word in text.split(' ')] 

text-" ".join(text) 


recurm tere 
data["tweet"] = data["tweet"].apply (clean) 


الآنء الخطوة التالية هی حساب درجات المشاعر oig (sentiment scores)‏ التغریدات 
وتعيين تسمية للتغريدات على igi‏ إيجابية (Posetive)‏ أو سلبية (Negative)‏ أو محايدة 
(Neutral)‏ إليك كيفية حساب درجات المشاعرفي التغريدات: 


from nltk.sentiment.vader import SentimentIntensityAnalyzer 
nltk.download('vader lexicon’) 

sentiments = SentimentIntensityAnalyzer () 

daralt EOS EA VON = [sentinemts ار‎ Sierras (aL) رت توا‎ for ab 
in data["tweet"]] 


Julai‏ المشاعر على Twitter‏ باستخدام بایئون 


data["Negative"] = [sentiments.polarity scores(i)["neg"] for i 

in data["tweet"] [ 

data Meu eral ll sentiments polarity scones (E) | کته اک‎ a 

in data["tweet"] [ 

الآن سأختار فقط الأعمدة من هذه البیانات التی نحتاجها لبقية مهمة تحلیل المشاعر على 
Twitter‏ : 


data = data[["tweet", "Positive", 
"Negative", "Neutral"] ] 
print (data.head()) 


tweet Positive Negative \ 


@ rt mayasolov woman shouldnt complain clean ho... 0.147 0.157 

1 rt boy dat coldtyga dwn bad cuffin dat hoe ... 6.008 0.280 

2 rt urkindofbrand dawg rt ever fuck bitch sta... 6.000 0.577 

3 rt cganderson vivabas look like tranni 0.333 0.000 

4 rt shenikarobert shit hear might true might f... 0.154 67 
Neutral 

e 06.696 

1 0.720 

2 0.423 

3 0.667 

4 0.440 


دعنا الآن نلقی نظرة على التصنیف الا کثر شيوعًا المخصص للتغریدات by‏ لدرجات المشاعر: 


x = sum(data["Positive"]) 
y = sum(data["Negative"]) 
z = sum(data["Neutral"]) 


def sentiment score ler lo, E 
if (a>b) and (a>c): 
print ("Positive © ") 
elif (b>a) and (b>c): 
print ("Negative Vn) 
elges 
print ("Neutral © un 
Sentiment score De ۸ رح‎ 


Neutral © 


لذا فإن معظم التغریدات محايدة (neutral)‏ ما يعني آنها ليست إيجابية ولا سلبية. OW‏ دعنا 
ab‏ نظرة على اجمالی درجات المشاعر: 


porine ) "26 عد ری ها لك‎ 
print("Negative: ", y) 
۱92221106 ("engl Y". A) 


Positive:  2880.086000000009 
Negative:  7201.020999999922 
Neutral: 14696.887999999733 
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ol 
ol 


مجموع التغریدات المحايدة أعلى بکثیر من السلبية والایجابية. لکن من بين جمیع التغریدات 
السلبية آکبر من التغریدات الإيجابيةء لذلك یمکننا القول إن معظم الاراء سلبية. 


الملخص 

هذه هي الطريقة التي يمكنك بها آداء مهمة تحلیل المشاعر على Twitter‏ باستخدام لغة برمجة 
بايثون. تحلیل المشاعر مهمة معالجة اللغة الطبيعية. تحتاج جمیع منصات وسائل التواصل 
الاجتماعي إلى التحقق من مشاعر الأشخاص المشاركينني المناقشة. آمل أن تکون قد أحبيت 
هذا المقال على تحليل المشاعر على Twitter‏ باستخدام بايثون. 


المصدر: 


https: //thecleverprogrammer.com/2021/09/13/twitter-sentiment- 
/analysis-using-python 


تحليل مشاعر لعبة الحبار باستخدام بایئون 


ار 
op)‏ 


Squid Game youl مشاعر لعبة الحبار باستخدام‎ Juni (10 


Sentiment Analysis using Python 


تعد لعبة الحبار Gl (squid game)‏ واحدة من آکثر العروض شیوعا على Netflix‏ من 
الشائع Ge‏ أن الأشخاص الذین لم یشاهدوا أي سلسلة ویب من قبل یشاهدونها أيضًا. آحد 
آسباب ذلك هو آراء وآراء المشاهدین على وسائل التواصل الاجتماعی. لذلك إذاكنت ترید معرفة 
LAS‏ تحلیل مشاعر الناس حول لعبة الحبار. فهذه المقالة DENT‏ هذه المقالة» سوف 
آخذك خلال مهمة تحلیل مشاعر لعبة الحبار باستخدام بايثون. 


تحلیل المشاعر لعبة الحبار باستخدام بایئون 

يتم تنزیل مجموعة البیانات التي آستخدمها لمهمة تحلیل مشاعر لعبة الحبار من Kaggle‏ والتي 
تم جمعهاني البداية من Twitter‏ بینما كان الاشخاص یشارکون بنشاط آراتهم حول لعبة الحبار. 
لنبداً مهمة تحلیل مشاعر لعبة الحبار عن طریق استیراد مکتبات بايثون ومجموعة البیانات 


الضروریة: 


import pandas as pd 
import seaborn as sns 


import matplotlib.pyplot as plt 


from nltk.sentiment.vader import SentimentIntensityAnalyzer 
from wordcloud import WordCloud, STOPWORDS, 


ImageColorGenerator 


data = pd.read csv("squid game.csv") 


source is retweet 


False 
False 
False 
False 
False 


Twitter for Android 
Twitter for Android 
Twitter Web App 
Twitter Web App 
Twitter Web App 


print (data.head()) 


user name user location ... 


0 the _Gndér-ratéd niggéh © NaN ... 
1 Best uncle on planet earth NaN ... 
2 marcie NaN ... 
3 YoMo.Mdp Any pronouns 

4 Laura Reactions France ... 


[5 rows x 12 columns] 


فى الانطباعات الأولى لمجموعة البیانات هذه لاحظت قيمًا خاليةفي عمود (user location)‏ 
يبدو أنها لا تؤثر على مهمة تحليل المشاعر. لذلك سوف احذف هذا العمود: 


data = data.drop(columns="user location", axis=1) 


دعنا OV‏ نلقي نظرة على ما إذا كانت الأعمدة الأخری تحتوي على أي قیم فارغة أم لا: 


DE 2110۲ datan SnU )( s vim (0) }) 


۳ لي a JI‏ اعر: عن طريق الا li‏ 


C1 
cuj 


user name 4 
user description 5211 
user created 
user followers 
user friends 
user favourites 
user verified 
date 

text 


source 


۵ © © © © © © © © 


is_retweet 
dtype: int64 


يحتوي عمود Cal (user description)‏ على قيم خالية. والتي لن توثر Cal‏ على مهمة تحلیل 
المشاعر. لذلك سأحذف هذا العمود Cail‏ 


axis=1) 


= data.dropna) 
مجموعة البیانات على آراء مستخدمی تویتر حول لعبة‎ (text) يحتوي عمود النص‎ 


data.drop(columns-"user description", 


data 
data 


الحيان 


فهذه آراء لوسائل التواصل الاجتماعيء لذا يجب تحضير هذا العمود قبل أي تحليل. لذلك دعونا 
نجهز هذا العمود لمهمة تحليل المشاعر: 


7 


import nltk 
import re 


nltk.download('stopwords') 


= nltk.SnowballStemmer ("english") 


stemmer 


from nltk.corpus import stopwords 


import string 


stopword=set (stopwords.words('english") ) 


def clean(text): 


text = str (text) . lower )( 

EERE = re sub N ON, YY, ieee) 

EEE = ie, SUD ) اسان‎ SA / // NST unio O را‎ EEE) 

text aemuli Mo TF, Text) 

text = re.sub('[$s]' 5 re.escape(string.punctuation), ' 
text) 

text - re Subn ''"' Ee) 

text = re.sub('Nw*NdNw*', '', text) 

text = [word for word in text.split(' ') if word not in 
stopword] 

text-" ".join(text) 

text = [stemmer.stem(word) for word in text.split(' ')] 

text-" ".join(text) 

return text 


= data["text"].apply(clean) 


| ع iE‏ | عون 


دعنا الآن نلقي نظرة على الکلمات الا کثر استخدامًاني آراء لعبة الحبار باستخدام سحابة الکلمات 
(word cloud)‏ سحابة الکلمات هی آداة تصوير البیانات تعرض الکلمات الا کثر استخدامًا 


تحلیل مشاعر لعبة الحبار باستخدام بایئون 


text = ۲ ".join(i for i in data.text) 

stopwords = set (STOPWORDS) 

wordcloud = WordCloud(stopwords-stopwords, 
background _color="white") .generate (text) 
plt.figure( figsize=(15,10) ) 
plt.imshow(wordcloud, interpolation-'bilinear') 
jolie ASS GEE) 


plt.show() 
۱ sal i squidgam 6۲1۷ fa 
squ 1d-game- 
۰ know 
game 5 one 


nisl 
squid green light red light iüÁ 
ade 


make ... " 9E Y cfe 


Ur a : episod squidgam 


watch quidga ame... 


squids am Juidgamet E q peopl apelin: 
الآن دعنا ننتقل إلى مهمة تحلیل المشاعرفي لعبة الحبار. سأضیف هنا ثلائة أعمدة آخری‌ني‎ 
(Neutral) ومحايدة‎ (Negative) وسلبية‎ (Positive) مجموعة البیانات هذه على آنها موجبة‎ 
عمود النص:‎ G(sentiment scores) من خلال حساب درجات المشاعر‎ 


nltk.download('vader lexicon’) 
sentiments = SentimentIntensityAnalyzer () 


036 ۱ possede = دنهد اور توا‎ (A) [PPOs] Tor 
in data["text"] ] 

[senctinemts Polarity SESE SN) [Mme cual COE‏ = ۱۳۱۱۵9 9 تا و6 
in data["text"] ]‏ 

dale all مهو وب ماس عوا >= 1م52 ةع‎ (aL) Meet o rt 
in data["text"] ] 

data = data[["text", "Positive", "Negative", "Neutral"] ] 

print (data.head()) 


text Positive Negative Neutral 


0 life hit time poverti strike yougong yoo let... 6.173 0.108 0.719 
1 marbl episod squidgam ruin © © © 0.000 0.487 0.513 
2 squidgam time 6.008 6.666 1.006 
3 blood slideim join squidgam thing im alreadi ... 0.142 9.277 0.581 
4 two first game player kill mask guy bloodi ni... 6.000 0.461 9.539 


دعنا الآن نحسب كيف يفكر معظم الناس في لعبة الحبار: 


x = sum(data["Positive"]) 
y = sum(data["Negative"]) 
z = sum(data["Neutral"]) 


def sentinent Geom (iei lor ©) 8 
ads (m9) mue! lasc): 


print ("Positive @ 


O1 
co 


۳ لي JI‏ ^ اعر: عن طريق الا Li‏ 05 


elif (b>a) and (b>c): 


print ("Negative ny 
else: 


print ("Neutral 5 i 
sentiment score(x, y, z) 


Neutral © 


لذا فإن معظم آراء المستخدمین ole‏ فلنلق الآن نظرة على إجمالي كل درجة المشاعر قبل 
التوصل إلى آي استنتاج: 
oring (LESSEE UU. xx‏ 
print("Negative: ", y)‏ 
Nemere Vy wu)‏ ۱922211 
Positive: 16664 76‏ 


Negative:  5171.334000000031 
Neutral: 64233.11800000302 


إجمالي السلبیات أقل بکثیر من الإيجابية» لذلك یمکننا القول إن معظم الاراء حول لعبة الحبار 


تعد لعبة الحبار G‏ واحدة من آکثر العروض شیوعا على Netflix‏ أحد آسباب ذلك هو آراء 
وآراء المشاهدین على وسائل التواصل الاجتماعی. آمل أن تکون قد أحببت هذا المقال حول 
تحلیل المشاعرفي لعبة الحبار باستخدام بایثون. 


المصدر: 


https: //thecleverprogrammer.com/2021/11/03/squid-game-sentiment- 
[analysis-using-python 


Julai‏ المشاعر في دردشة WhatsApp‏ باستخدام بایئون 


11( تحلیل المشاعر في دردشة WhatsApp‏ باستخدام بایئون 
WhatsApp Chat Sentiment Analysis using Python‏ 
يعد WhatsApp‏ مصدرا رائعًا للبیانات لتحلیل العدید من الأنماط والعلاقات بين شخصین أو 
آکثر یتحدئون شخصيًا أو حتفي مجموعات. إذا كنت ترید أن تعرف كيف یمکننا تحلیل مشاعر 
دردشة WhatsApp‏ فهذه المقالة مناسبة لك.في هذه المقالة» سوف أطلعك على مهمة تحلیل 
المشاعرفي دردشة zb WhatsApp‏ ستخدام بایئون. 
تحلیل المشاعر دردشة WhatsApp‏ 
لتحلیل مشاعر دردشة «WhatsApp‏ نحتاج إلى جمع البیانات من -WhatsApp‏ يجب أن 
الخطوات المذكورة آدناه: 
1 للایفون: 

1 افتح الدردشة الخاصة بك مع شخص أو مجموعة. 

2 فقط اضغط على ملف تعریف الشخص أو المجموعة. 

3 ستری خیارّا لتصدير الدردشة بالأسفل. 

4 لأجهزة الأندرويد: 

1 افتح الدردشة الخاصة بك مع شخص أو مجموعة. 

2 انقر فوق النقاط الثلاث آعلاه. 

3. انقر فوق المزید. 

GM 4‏ فوق دردشة التصدیر. 
ستری GLE‏ لارفاق الوسائط آثناء تصدیر الدردشة. من أجل البساطة. من الأفضل عدم إرفاق 
الوسائط. أخيرًاء آدخل بریدك الالکترونی وستجد دردشة A WhatsApp‏ صندوق الوارد الخاص 


تحلیل مشاعر الدردشة عبر WhatsApp‏ باستخدام بایئون 
لنبدأ OY‏ بمهمة تحلیل مشاعر الدردشة عبر WhatsApp‏ باستخدام بایشون. سأبدأ هذه المهمة 
بتحدید بعض الدوال المساعدة oY‏ البیانات التي نحصل عليها من WhatsApp‏ ليست 


TIME 


مجموعة بیانات جاهزة للاستخدام‌في أي نوع من مهام علم البیانات. لذلك. لاعداد بياناتك لمهمة 
تحلیل المشاعر ما عليك سوی تحدید جمیع الدوال علی النحو المحدد آدناه: 


import re 

import pandas as pd 

import numpy as np 

import emoji 

from collections import Counter 

import matplotlib.pyplot as plt 

from PIL import Image 

from wordcloud import WordCloud, STOPWORDS, 
ImageColorGenerator 


# Extract Time 
def date time(s): 

partera = OSO) OW) (lOO) OP) (9-91) o CIOS 
9]+):(({0-9]+) [ ]?(AM|PM|am|pm)? -' 

result = re.match(pattern, s) 

iE 255 انا‎ a 

return True 
return False 


# Find Authors or Contacts 
def find author(s): 
SS o Solne (V6) 
if len(s)==2: 
return True 
else: 
return False 


# Finding Messages 

def getDatapoint(line): 
splitline = line.split(' - ') 
dateTime = splitline[0] 


date, time - dateTime.split(", ") 
message - " ".join(splitline[1:]) 
if find author (message): 
splitmessage = message.split(": ") 
author = splitmessage[0] 
message = " ".join(splitmessage[1:]) 
else: 


author= None 
return date, time, author, message 


لا يهم إذاكنت تستخدم مجموعة بیانات دردشة جماعية أو محادئتك مع شخص واحد. ستعمل 


جمیع الدوال المحددة آعلاه على إعداد بياناتك لمهمة تحلیل المشاعر وأي مهمة تتعلق بعلم 
البیانات. الآن إليك كيف يمكننا إعداد البیانات التي جمعناها من WhatsApp‏ باستخدام الدوال 


لمذكورة آعلاه: 
data = []‏ 
conversation = 'WhatsApp Chat with Sapna.txt'‏ 
with open(conversation, encoding="utf-8") as fp:‏ 


fp. readline )( 


تحليل المشاعر في دردشة WhatsApp‏ باستخدام بایئون 


messageBuffer = [] 
date, time, author = None, None, Non 
while True: 
line = fp.readline() 
TE moO ine? 
break 
line = line.strip() 
if date time(line): 
if len(messageBuffer) > 0: 
data.append([date, time, author, ' 
'. join (messageBuffer)]) 
messageBuffer.clear() 
date, time, author, message - getDatapoint(line) 
messageBuffer.append (message) 
else: 
messageBuffer.append(line) 


الآن إليك كيف یمکننا تحلیل مشاعر دردشة WhatsApp‏ باستخدام بایشون: 


df = pd.DataFrame (data, columns=["Date", 'Time', 'Author', 


'Message']) 

df['Date'] = pd.to datetime (df['Date']) 

data = df.dropna() 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
sentiments = SentimentIntensityAnalyzer () 

data possessed = semcimeniusemoptramsu y scores Moos هط‎ ae 
in data["Message"]] 

data["Negative"] = [sentiments.polarity scores(i)["neg"] for i 
in data["Message"]] 

date all Nene | = fsentirents زر )وتو وم‎ || Miner] or ab 


in data["Message"] ] 
print (data.head()) 


Date Time Author ... Positive Negative Neutral 

6 2020-04-06 12:36 pm Sapna ... 6.8 6.000 1.000 

1 2020-04-06 12:30 pm Sapna ... e.e 6.000 1.000 

2 2020-04-06 12:54 pm Aman Kharwal ... 6.8 6.008 1.000 

3 2020-04-06 12:55 pm Sapna ... e.e 0.383 0.617 

4 2020-04-06 1:00 pm Aman Kharwal ... e.e 6.666 1.000 
x — sum(data["Positive"]) 


y = sum(data["Negative"]) 
z = sum(data["Neutral"]) 


def sentinent Geom (a, Io, (Gs 
aig (ao 24ت‎ (asic) 8 
print ("Positive © ") 
elif (b>a) and (b>c): 
print ("Negative 15) 
else: 
print ("Neutral e 2 
senbimenmtgsconelPs yo 2) 


Output: 
Neutral & 


تحلیل المشاعر: عن طريق الامئلة 63 


لذاء فإن البیانات التي استخدمتها تشیر إلى أن معظم الرسائل بيني وبين الشخص الآخر محايدة 
.(neutral)‏ مما يعني أنه لیس (positive) Bee!‏ آو .(negative) eL.‏ 

الملخص 

إذن هذه هي الطريقة التي يمكننا بها أداء مهمة تحليل المشاعرفي دردشة .WhatsApp‏ يعد 
WhatsApp‏ مصدرًا Gil‏ للبیانات لمهمة تحليل المشاعر وكل مهمةفي علم البيانات تعتمد على 
معالجة اللغة الطبيعية. آمل أن تكون قد أحببت هذه المقالة حول مهمة تحليل المشاعرفي دردشة 
WhatsApp‏ باستخدام بايثون. 


المصدر: 


https: //thecleverprogrammer.com/2021/06/06/whatsapp-—chat- 


[sentiment-analysis-using-python 


Julai‏ المشاعر في تقییمات منتجات Amazon‏ باستخدام بایئون 


2 تحلیل المشاعر في تقییمات منتجات Amazon‏ باستخدام بایئون 
Amazon Product Reviews Sentiment Analysis with Python‏ 
0 هي شركة أمريكية متعددة الجنسیات ترکز على التجارة الإلكترونية والحوسبة السحابية 
والبث الرقمي ومنتجات الذکاء الاصطناعي. لكنها معروفة بشکل آساسي بمنصة التجارة 
الالكترونية الخاصة بها والتي تعد واحدة من آکبر منصات التسوق عبر الانترنت الیوم. هناك الکثیر 
من العملاء الذین يشترون المنتجات من Amazon‏ حتی أن Amazon‏ تکسب اليومفي المتوسط 
1 ملیون دولارني الیوم. لذاء فان وجود مثل هذه القاعدة الکبيرة من العملاء سیصبح 
مشروعا رائعًا لعلم البیانات إذا تمکنا من تحلیل مشاعر مراجعات منتجات Amazon‏ . لذلك 
في هذه المقالة. سوف آطلعك على مهمة تحلیل آراء مراجعات منتجات Amazon‏ باستخدام 
بايثون. 


تحليل المشاعر في تقييمات منتجات Amazon‏ باستخدام بايثون 

تم تنزيل مجموعة البيانات التي أستخدمها لمهمة تحليل آراء مراجعات منتجات Amazon‏ من 
.Kagele‏ تحتوي مجموعة البيانات هذه على مراجعات المنتجات لأكثر من 568000 عميل 
اشتروا منتجات من Amazon‏ فلنيدأ هذه المهمة عن طريق استيراد مكتبات بايثون ومجموعة 
البيانات الضرورية: 


import pandas as pd 

import seaborn as sns 

import matplotlib.pyplot as plt 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
sentiments = SentimentIntensityAnalyzer () 


datas = gel reac Cey (URS vi EWS ie SA 
print (data.head()) 


Id  ProductId UserId ProfileName \ 
و‎ 1 80018410۴69 A3SGXH7AUHUSGH delmartian 
1 2 8008136864 ۵1۵87۴6265 dll pa 
2 3 B@@@LQOCH@ ABXLMWIIXXAIN Natalia Corres "Natalia Corres" 
3 4 309018901 0 Karl 
4 5 80061022271 AIUQRSCLFSGWIT Michael D. Bigham "M. Wassir" 
HelpfulnessNumerator HelpfulnessDenominator Score Time \ 
8 1 1 5 1303862400 
1 e e 1 1346976000 
2 1 1 4 1219017600 
3 3 3 2 1307923200 
4 e e 5 1350777600 
Summary Text 
و‎ Good Quality Dog Food I have bought severa: 1 of the Vitality canned d... 
1 Not as Advertised Product arrived labeled as Jumbo Salted Peanut... 
2 "Delight" says it all This is a confection that has been around a fe... 
3 Cough Medicine If you are looking for the secret ingredient i... 
4 Great taffy Great taffy at a great price. There was a wid... 


قبل المضی قدمّ دعنا 


نلقى نظرة على بعض المعلومات المطلوبة من de pares‏ البیانات هذه: 


تحلیل المشاعر: عن طريق الامئلة 


(ey 
ol 


print (data.describe () ) 


Id HelpfulnessNumerator HelpfulnessDenominator ١ 


568454. 000000 568454 . 8 

1.743817 2.22881 

7.636513 8.28974 

6. 000000 6. 06066 

6. 0009000 0.00000 

6. 000000 1.00000 

2.000000 2.00000 

866.000000 923.00000 
Time 
.684540e«05 
. 296257 وو+ع‎ 
-804331e+07 
.393408e«08 
271290e4«09 
.311120e4«09 
.332720e«09 
.351210e+09 


P مو مو مو‎ © DB HP wu 


. 000000 
.500000 
.679298 
. 000000 
.250000 
.500000 
«750000 


0000090 


Score 


000000 


. 000000 
.183199 
.310436 


. 000000 
. 000000 
. 000000 
. 000000 


count 568454 
mean 284227 
std 164098 
min 1 
25% 142114 
50% 284227 
75% 426340 
max 568454. 


count 568454 
mean 4 
std 1 
min 1. 
25% = 
50% 5 
75% 5 
max 5 


نظرًا oy‏ مجموعة البیانات هذه كبيرة rom‏ فهي تحتوي على بعض القیم المفقودة ) missing‏ 
«(values‏ لذا دعنا نزيل جمیع الصفوف التي تحتوي على القيم المفقودة: 


data = data.dropna() 


تحلیل المشاعر لمراجعات منتجات Amazon‏ 
يحتوي عمود النقاط (Score column)‏ مجموعة البیانات هذه على التصنیفات التي منحها 
العملاء للمنتج بناءً على تجربتهم مع المنتج. لذلك دعونا نلقي نظرة على تفاصیل التصنیف 
لمعرفة كيف یقوم معظم العملاء بتقييم المنتجات التي یشترونها من :Amazon‏ 


ratings = data["Score"].value counts )( 
numbers = ratings.index 
quantity = ratings.values 


["skyblue", "yellowgreen", 'tomato', "blue", 


0.5, color='white') 


custom collors = 


sees] 


plt.figure(figsize-(10, 8)) 
plt.pie(quantity, labels-numbers, colors-custom colors) 
ات له او‎ 
ELG = jolie GEE) 
Tie 09 (۰ ace AECL (OSEAN تت‎ ere) 
jode s eer (| V deoa" y 
او ها ار هر‎ We) LDS EET كن‎ 215121 (eus Amazan EEOIUEE Racines; 
fontsize=20) 


= plte CL OLE (tq. (8 


size=12) 


plt.show() 


تحلیل المشاعر في تقییمات منتجات Amazon‏ باستخدام بایئون 


Distribution of Amazon Product Ratings 


5 


Gis‏ للشکل آعلاه. صنف آکثر من نصف الأشخاص المنتجات التي اشتروها من Amazon‏ ب 
5 نجوم. وهو آمر جید. OM‏ سأضيف ثلاثة أعمدة آخری إلى مجموعة البیانات هذه على أنها 
موجبة (Positive)‏ وسلبية (Negative)‏ ومحايدة (Neutral)‏ من خلال حساب درجات 
المشاعر (sentiment scores)‏ لمراجعات العملاء المذكورةفي عمود التص (Text column)‏ 
لمجموعة البیانات: 


sentiments = SentimentIntensityAnalyzer () 


cadeau possess eM a SERE MEME SPOOL ya scorcesi [| yore" tor at 
in data["Text"]] 

618:53 ] ۰۱۱6۵ هه‎ | = sentiments: polarity scores (a) ۱۳ نع‎ EOE i 
in data["Text"] ] 

0219 ۱۳۱ ایو و‎ 1222225 polarity 5 Cones: (8) memo 
in data["Text"] [ 


print (data.head()) 


Id ProductlId UserId ... Positive Negative Neutral 
8661641۴69  A3SGXH7AUHUSGM ... 0.305 6.666 0.695 
8668136864 A1D87F6ZCVESNK ... 6.066 0.138 0.862 
8680610061۲9 ۰ ABXLMWJIXXAIN ... 0.155 0.091 0.754 


86660826010 39580۴606۴6 ... 0.000 6.666 1.000 
80661622271 AlUQRSCLF8GWIT ... 0.448 0.000 0.552 


wNMHÍ| ©‏ د 
ر نم إن كه ما 


[5 rows x 13 columns] 


Les‏ الآن نری كيف قام معظم الناس بتقییم المنتجات التي اشتروها من آمازون: 


x = sum(data["Positive"]) 
y = sum(data["Negative"]) 
z = sum(data["Neutral"]) 


def sencsimenmigscone (el, lo, E 
if (a>b) and (a>c): 
print ("Positive © ") 
elif (b>a) and (b>c): 
print ("Negative 2 
else: 
print ("Neutral © m 


TIME 


sentiment score(x, y, z) 


Neutral @ 


لذلك. یکون معظم الأشخاص محایدین عند إرسال تجاربهم مع المنتجات التي اشتروها من 
23 الآن bes‏ نری إجمالي جمیع درجات المشاعر : 


192221106 ۱۳۱2/۵/2 weg Wo. xx) 
print("Negative: ", y) 
دع عا 2 ) عا لضم‎ Wy xm 


Positive:  109328.1269999992 
Negative: 33 4 
Neutral: 435042 6 


لذلك یمکننا القول إن معظم المراجعات للمنتجات المتاحة على Amazon‏ ایجابية. حیث أن 
إجمالي درجات المشاعر الايجابية والمحايدة Hel‏ بکثیر من النتائج السلبية. 


الملخص 

إذن هذه هي الطريقة التي یمکننا بها تحلیل مشاعر مراجعات المنتجفي ۰۸۱220 هناك الكثير 
من العملاء الذین یشترون المنتجات من Amazon‏ حتی أن e JI SS Amazon‏ المتوسط 
638.1 مليون دولارفي اليوم. لذاء فإن وجود مثل هذه القاعدة الکبيرة من العملای سیصیح 
مشروعا رائعًا لعلوم البیانات إذا تمکنا من تحلیل مشاعر مراجعات منتجات Amazon‏ آمل أن 
تکون قد أحببت هذه المقالة حول تحلیل المشاعر لمراجعات Amazon.‏ باستخدام بایشون. 


المصدر: 


https: //thecleverprogrammer.com/2021/07/20/amazon-product- 


[reviews-sentiment-analysis-with-python 


تحليل مشاعر تقييمات الفندق مع بايثون 68 


Hotel Reviews تحليل مشاعر تقييمات الفندق مع بايثون‎ (13 
Sentiment Analysis with Python 

عندما نبحث عن Gold‏ لقضاء الاجازة أو السفی نفضل Glo‏ فندقّا معروفا بخدماته. آفضل 
طريقة لمعرفة ما إذاكان الفندق مناسبًا لك آم لا هي معرفة ما یقوله الناس عن الفندق الذي آقام 
هناك من قبل. من الصعب OW LEU‏ قراءة تجربة کل شخص آبدی Gals‏ خدمات الفندق. هذا 
هو المكان الذي تأتي فيه مهمة تحلیل المشاعر (sentiment analysis)‏ .3( هذه المقالة» سوف 
أطلعك على مهمة تحليل مشاعر تقييمات الفندق Hotel Reviews Sentiment)‏ 
(Analysis‏ باستخدام بايثون. 


تحليل مشاعر تقييمات الفندق مع بايثون 

يتم جمع مجموعة البيانات التي آستخدمها لمهمة تحليل آراء الفنادق من -Kaggle‏ يحتوي على 
بيانات حول 20000 تقييم للأشخاص حول خدمات الفنادق التي آقاموا فيها لقضاء عطلة أو 
رحلة عمل أو أي نوع من الرحلات. تحتوي مجموعة البيانات هذه على عمودين فقط كمراجعات 
(Reviews)‏ وتقييمات (Ratings)‏ للعملاء. لذا فلنبداً بمهمة تحليل آراء الفنادق باستخدام 
بايثون من خلال استيراد مكتبات بايثون ومجموعة البيانات اللازمة: 


import pandas as pd 

import seaborn as sns 

import matplotlib.pyplot as plt 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
sentiments = SentimentIntensityAnalyzer () 


data = pd.read csv("hotel reviews.csv") 
print (data.head()) 


Review Rating 
nice hotel expensive parking got good deal sta... 4 
ok nothing special charge diamond member hilto... 
nice rooms not 4* experience hotel monaco seat... 


unique, great stay, wonderful time hotel monac... 


Pw ی‎ FP © 
ص صن‎ wn 


great stay great stay, went seahawk game ۰ 


مجموعة البيانات هذه كبيرة جد ولحسن الحظ لا توجد قيم مفقودة لذا دون إضاعة أي وقت. 
دعنا نلقي نظرة سريعة على توزيع تقييمات العملاء: 


ratings data["Rating"].value counts )( 
numbers ratings.index 
quantity = ratings.values 


custom colors = ["skyblue", "yellowgreen", 'tomato', "blue", 
ice ] v 

plt.figure(figsize-(5, 5)) 

plt.pie(quantity, labels-numbers, colors-custom colors) 
Central circle = plt- Circite((0, OJ, ob د وت‎ unite") 


تحلیل المشاعر: عن طريق الامئلة 69 


Enc ex 1۱۵ sues )ا‎ 

OCS (0) «OO artist (Simmel errele)‏ فرط 
plt.rc('font', size=12)‏ 

plt.title ("Hotel Reviews Ratings", fontsize=20) 
plt.show() 


Hotel Reviews Ratings 


5 


یمکن ملاحظة أن معظم النزلاء قیموا الخدمات الفندقية ب 5 نجوم و4 نجوم. لذلك Gi,‏ 
للتصنیفات المذكورة أعلاه. یمکننا القول إن معظم الضیوف راضون عن خدمات الفندق الذي 
آقاموا فيه. دعنا OYI‏ نمضي قدمّا من خلال تحلیل مشاعر تقییمات الفنادق. لتحلیل وجهة نظر 
تقییمات الفندق. سأضيف ثلاثة أعمدة اضافية إلى مجموعة البیانات هذه على آنها ايجابية 
(Positive)‏ وسلبية (Negative)‏ ومحايدة (Neutral)‏ خلال حساب درجات المشاعر 


(sentiment scores)‏ للتقییمات: 


sentiments = SentimentIntensityAnalyzer () 


cara LEO SE أن‎ || = SERE MERE SPOLETO sierodeys) (at) [| ores EOE at 
in data["Review"] ] 

data["Negative"] = [sentiments.polarity scores(i)["neg"] for i 
in data["Review"] ] 

data["Neutral"] = [sentiments.polarity scores(i)["neu"] for i 


] 
) 


in data["Review"] 
print (data.head() 


Review Rating Positive Positive Negative Neutral 
nice hotel expensive parking got good deal sta... 4 @.285 0.285 0.072 9.643 


ok nothing special charge diamond member hilto... 2 0.189 0.189 0.110 0.701 
nice rooms not 4* experience hotel monaco seat... 3 0.219 0.219 0.081 0.700 
unique, great stay, wonderful time hotel monac... 5 0.385 0.385 0.060 0.555 
great stay great stay, went seahawk game aweso... 5 0.221 0.221 0.135 0.643 


G3,‏ للتقییمات (reviews)‏ يبدو أن ضیوف الفندق راضون عن الخدمات. GLB‏ الآن نظرة 
على رأي معظم الناس‌في خدمات الفنادق ely‏ على مشاعر تقییمهم: 


x = sum(data["Positive"]) 
sum (data["Negative"]) 
z = sum(data["Neutral"]) 


> 
1 


تحلیل مشاعر تقییمات الفندق مع بایئون 


def Sentiment Sseore (a, O, CJ: 
if (a>b) and (a>c): 
print ("Positive H) 
elif (b>a) and (b>c): 
print ("Negative لاا‎ 
else: 
print ("Neutral © 2 
sentiment Score (x, y, 2) 


Neutral © 


وبالتالي» يشعر معظم الناس بالحياد (neutral)‏ تجاه خدمات الفندق. الآن Ab bes‏ نظرة 
فاحصة على نتائج المشاعر: 
عد ری رها Drine (LESS‏ 


print("Negative: ", y) 
prime رت هه‎ 2) 


Positive: 59 2 
Negative: 1473 8 
Neutral: 12657 7 


وبالتالي à s‏ للنتائج المذكورة أعلاه» تم تصنیف آکثر من 12000 مراجعة على آنها محايدة 


وتم تصنیف آکثر من 6000 مراجعة على Lal‏ ايجابية. لذلك یمکن القول إن الناس سعداء حقا 
بخدمات الفنادق التی آقاموا فیها حیث أن التقییمات السلبية أقل من 1500. 


الملخص 

هذه هي الطريقة التي يمكنك بها تحلیل مشاعر تقییمات الفنادق. أفضل طريقة لمعرفة ما إذاكان 
الفندق Late‏ لك أم لا هي معرفة ما يقوله الناس عن الفندق الذي آقام هناك من قبل. هذا هو 
المکان الذي يمكن أن تساعدك فيه مهمة تحلیل مشاعر تقییمات الفندق على تحدید ما إذا كان 
الفندق مناسبًا لرحلتك el‏ لا. آمل أن تکون قد أحببت هذه المقالة حول تحلیل المشاعر لتقییمات 
الفنادق باستخدام بایثون. 


المصدر: 


https: //thecleverprogrammer.com/2021/07/03/hotel-reviews- 


[sentiment-analysis-with-python 


Julai‏ المشاعر في Google Play jaio‏ باستخدام بایئون 


Google باستخدام بایئون‎ Google Play jaio تحلیل المشاعر في‎ 4 
Play Store Sentiment Analysis using Python 

تحلیل المشاعر (Sentiment analysis)‏ هو تصنیف لمراجعات العمیل أو تعلیقاته على آنها 
إيجابية Clot, (negative) 4 es» (positive)‏ محايدة Cal (neutral)‏ تحلل معظم 
الأنشطة التجارية مشاعر عملائها حول منتجاتهم أو خدماتهم لمعرفة ما يريده عملاژهم منهم. 
يحتوي متجر Google play‏ على ملایین التطبیقات مع مراجعاتها. لذا ستکون حالة استخدام 
جيدة لتحلیل المشاعر لتحلیل مشاعر التطبیقات المتاحة على متجر GU .Google play‏ 
هذه المقال» سوف آطلعك على مهمة تحلیل (à e JI‏ متجر Google Play‏ باستخدام بایون. 


تحلیل المشاعر في متجر Google Play‏ 

يمكن العثور على متجر Google Play‏ على جمیع الهواتف الذكية والأجهزة اللوحية التي تعمل 
Android ees‏ هذا هو متجر تطبیقات Google‏ الرسمي eJ‏ التشغیل Android‏ يحتوي 
على ملایین التطبیقات مع مراجعاتها حتی نتمکن من استخدام مثل هذا القدر من البیانات لأي 
مهمة تتعلق بعلم البیانات. تحلیل آراء العملاء وتعليقاتهم هو ما نقوم بهفي مهمة تحلیل المشاعر. 
بعد قولي gdis‏ القسم آدناه. سوف آطلعك على مهمة تحلیل المشاعرفي متجر Google Play‏ 
باستخدام بایثون. یمکن تنزیل مجموعة البیانات التي آستخدمهاني هذه المهمة من هنا. 


تحلیل المشاعر في متجر Google Play‏ باستخدام بایئون 
سأبدأ هذه المهمة بقراءة مجموعة البیانات. يتم تنزیل مجموعة البیانات التي آستخدمها هنا من 
Kaggle‏ والتي تم جمعها من متجر Google Play‏ . فلنبداً هذه المهمة بقراءة مجموعة البیانات: 


from itertools import count 

EFO علج ات‎ ueil moore joie 

import pandas as pd 

data = pd.read_csv("user reviews.csv") 
print (data.head()) 


App ... Sentiment Subjectivity 
6 10 Best Foods for You ... 0.533333 
1 10 Best Foods for You ... 0.288462 
2 10 Best Foods for You ... NaN 
3 10 Best Foods for You ... 0.875000 
4 160 Best Foods for You ... 0.300000 


قبل المضي قدمًاء دعنا نلقي نظرة على ما إذا كانت مجموعة البیانات هذه تحتوي على أي قیم 
مفقودة أم لا: 


تحلیل المشاعر: عن طريق الامئلة 


print (data.isnull().sum() ( 


App 6 
Translated_Review 26868 
Sentiment 26863 
Sentiment_Polarity 26863 


Sentiment_Subjectivity 26863 
dtype: int64 


إذاً تحتوي على بعض القیم الفارغة. سأقوم بانشاء مجموعة بیانات جديدة باسقاط القیم الخالية: 


data = data.dropna() 
DE ارت‎ (daran msnu MOSM) 


App 


Translated_Review 


6 
6 
Sentiment 6 
Sentiment_Polarity e 
e 


Sentiment Subjectivity 
dtype: int64 

الآن لتحليل المشاعر الخاصة بمراجعات متجر google play‏ » سأضيف ثلاثة أعمدة جديدةفي 
مجموعة البيانات من خلال فهم مشاعر كل مراجعة للعميل على أنها إيجابية وسلبية ومحايدة: 


from nltk.sentiment.vader import SentimentIntensityAnalyzer 
sentiments = SentimentIntensityAnalyzer () 


cereal positive] = [sentinenmts Polarity SCORES) COS EOE at 
in data["Translated Review"] [ 

data["Negative"] = [sentiments.polarity scores(i)["neg"] for i 
in data["Translated Review"] [ 

EOE ab‏ ات ۱ NewiemeL = [sentinents Polarity Scores (aL)‏ ] 9 تاداع 
in data["Translated Review"]]‏ 


print (data.head()) 


App Translated Review ... Negative Neutral 
6 10 Best Foods for You I like eat delicious food. That's I'm cooking ... ... e.e 6.466 
3 10 Best Foods for You Works great especially going grocery store 6.8 6.549 
4 10 Best Foods for You Best idea us ... e.e 0.323 
5 10 Best Foods for You Best way 0.0 @.192 


والان کخطوة آخیرق. دعنا نلقي نظرة على مشاعر العملاء حول التطبیقات المتاحةفي متجر 
Google play‏ باستخدام مخطط مبعثر (scatter plot)‏ 


woore 112 وا الع 16ت‎ oyolor AS pibe 

import seaborn as sns 

plt.figure(figsize-(15, 10) ) 

sns.scatterplot (data['Sentiment Polarity'], 

data['Sentiment Subjectivity'], 

hue = data['Sentiment'], edgecolor-'white', 
واه للك كر‎ twi eese cie 

plt.title("Google Play Store Reviews Sentiment Analysis", 
fontsize=20) 

plt.show() 


تحلیل المشاعر في متجر Google Play‏ باستخدام بایئون 


=| 
oD 


Google Play Store Reviews Sentiment Analysis 
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Neutral 
0.04 ® Negative oo 


-1.00 -0.75 -0.50 -0.25 0.00 0.25 0.50 0.75 1.00 
Sentiment_Polarity 


الملخص 

إذن هذه هي الطريقة التي یمکننا بها تحلیل مشاعر مراجعات متجر google play‏ تحليل 
المشاعر هو تصنیف لمراجعات العمیل أو تعلیقاته على آنها ايجابية وسلبية ومحايدة. أتمنى أن 
تكون قد أحببت هذه المقالة حول مهمة تحلیل مشاعر متجر Google play‏ باستخدام بایشون. 


المصدر: 


https://thecleverprogrammer.com/2021/05/31/google-play-store- 


[sentiment-analysis-using-python 


تحلیل مشاعر مراجعات Amazon Alexa‏ باستخدام بایئون 


15( تحلیل مشاعر مراجعات Amazon Alexa‏ باستخدام بایئون 
Amazon Alexa Reviews Sentiment Analysis using Python‏ 

Amazon Alexa‏ هي خدمة صوتية مستندة إلى السحابة تم تطویرها بواسطة Amazon‏ تتبح 
للعملاء التفاعل مع التکنولوجیا. يوجد CUm‏ أكثر من 40 ملیون مستخدم ل Alexa‏ حول العالم 
لذا فإن تحلیل مشاعر المستخدمین حول Alexa‏ سیکون مشروعًا جیدا لعلم البیانات. لذاء إذا 
كنت تريد معرفة كيفية تحلیل مشاعر المستخدمین باستخدام Amazon Alexa‏ فهذه المقالة 
مناسبة لك.في هذه UES!‏ سأوجهك خلال مهمة تحلیل Amazon Alexa ehl‏ باستخدام 


بايثون. 


تحليل مشاعر مراجعات Amazon Alexa‏ باستخدام بایئون 

تم جمع مجموعة البیانات التي أستخدمها لمهمة تحلیل المشاعر لمراجعات Amazon Alexa‏ 
من -Kaggle‏ يحتوي على بیانات حول التصنیفات بين 1 و £5 وتاریخ المراجعات ‏ وتعلیقات 
العملاء حول تجربتهم مع WI . Alexa‏ دعونا نستورد مجموعة بیانات ومکتبات بایثون 
الضرورية التي نحتاجها لهذه المهمة: 


import pandas as pd 

import seaborn as sns 

import matplotlib.pyplot as plt 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
sentiments = SentimentIntensityAnalyzer () 


data = 

pd.read csv("https://raw.githubusercontent.com/amankharwal/Web 
site-data/master/amazon alexa.tsv", delimiter-'Nt') 

print (data.head()) 


rating date variation verified reviews feedback 
e 5 31-Jul-18 Charcoal Fabric Love my Echo! 1 
1 5 31-Jul-18 Charcoal Fabric Loved it! 1 
2 4 31-Jul-18 Walnut Finish Sometimes while playing a game, you can answer... 1 
3 5 31-Jul-18 Charcoal Fabric I have had a lot of fun with this thing. My 4... 1 
4 5 31-Jul-18 Charcoal Fabric Music 1 


لنبدأ بإلقاء نظرة على بعض المعلومات الموجودةني تلك البيانات لمعرفة ما إذا كنا بحاجة إلى 
print (data. 465116 () )‏ 


print (data.isnull().sum() ) 
print (data.columns) 


يحتوي عمود تصنيف مجموعة البيانات (dataset’s rating column)‏ على التقییمات التي 
قدمها مستخدمو Amazon Alexa‏ بمقياس من 1 إلى ۰5 حيث يمثل الرقم 5 أفضل تقييم. 


75 تحليل المشاعر: عن طريق الامثلة‎ 
rating feedback 
count 3150.000000 3150.000000 
mean 4.463175 0.918413 
std 1.068506 0.273778 
min 1.000000 0.000000 
25% 4.000000 1.000000 
50% 5.000000 1.000000 
75% 5.000000 1.000000 
max 5.000000 1.000000 
rating e 
date e 
variation e 
verified reviews e 
feedback e 


dtype: int64 


Index(['rating', 'date', 'variation', 'verified reviews', 'feedback'], dtype='object') 
یمکن للمستخدم تقدیمه. لذلك دعونا نلقي نظرة على توزیع التقییمات التي منحها مستخدمو‎ 
:Amazon Alexa 


ratings = data["rating"].value counts )( 
numbers = ratings.index 
quantity = ratings.values 


custom colors = ["skyblue", "yellowgreen", 'tomato', "blue", 
۱۰ | zi 

plt.figure(figsize=(5, 5)) 

plt.pie(quantity, labels=numbers, colors-custom colors) 
central cirele = plt Circle((0; OJ, ub, color= white") 

E = PIECE (D) 

ENG iCal) add acts El CeRE EAN errele) 

Dilles BEN LEONEL, Sze =2) 

plt.title ("Amazon Alexa Reviews", fontsize=20) 

plt.show() 


Amazon Alexa Reviews 


من الشكل أعلاه. یمکننا أن نری أن معظم العملاء قد صنفوا gl Amazon Alexa‏ ذلك جمیع 
متغيراتها على آنها 5. لذا فهذا يعني أن معظم العملاء سعداء بخدمة -Amazon Alexa‏ 


تحلیل مشاعر مراجعات Amazon Alexa‏ باستخدام بایئون 


تحلیل مشاعر مراجعات Amazon Alexa‏ 

الآن دعنا ننتقل إلى مهمة تحلیل المشاعر لمراجعات Alexa‏ يحتوي عمود المراجعات التي تم 
التحقق منها (verified reviews column)‏ مجموعة البیانات على جمیع المراجعات التي 
قدمها عملاء Amazon Alexa‏ . لذلك دعونا نضیف آعمدة جديدة إلى هذه البیانات على آنها 
أعمدة إيجابية (Positive)‏ وسلبية (Negative)‏ ومحايدة (Neutral)‏ من خلال حساب 
درجات المشاعر للمراجعات (sentiment scores)‏ 


sentiments = SentimentIntensityAnalyzer )( 


data["Positive"] = [sentiments.polarity scores(i)["pos"] for i 
in data["verified reviews"] ] n 

data["Negative"] = [sentiments.polarity scores(i)["neg"] for i 
in data["verified reviews"]] 5 

data["Neutral"] = [sentiments.polarity scores(i)["neu"] for i 


in data["verified reviews") ] 
print (data.head()) 


rating date variation ... Positive Negative Neutral 
6 5 31-Jul-18 Charcoal Fabric eee 0.692 0.000 0.308 
1 5 31-Jul-18 Charcoal Fabric m 67 6.666 6.193 
2 4 31-Jul-18 Walnut Finish eee 0.114 0.102 0.784 
3 5 31-Jul-18 Charcoal Fabric ... 0.383 6.666 6.617 
4 5 31-Jul-18 Charcoal Fabric see 6.000 8.000 1.000 


Amazon Alexa نلخص درجات المشاعر لكل عمود لفهم ما يعتقده معظم عملاء‎ oW bes 


بشانه: 


x = sum(data["Positive"]) 
y = sum(data["Negative"]) 
z = sum(data["Neutral"]) 


demesendimenmtescorel(a mb) 
TE (eao) mel (a>c) 8 
print ("Positive © ") 
elif (b>a) and (b>c): 
print ("Negative 12) 
elses 
print ("Neutral © y 
sentiment score(x, y, z) 


Neutral &‏ 
وبالتالي» فان الناتج النهاتي الذي نحصل عليه یکون محایدا. هذا يعني أن معظم المستخدمین 
یشعرون بالحیاد تجاه خدمات Amazon Alexa‏ دعنا OI‏ نری مجموع درجات المشاعر لكل 
عمود. 


prime ) رس علب نظ‎ zx) 
print("Negative: ", y) 


5 لي J‏ ^ اعر: عن طريق الا ثلة 77 


BERE ) رت ای‎ 2 
Positive: 1035.4579999999983 


Negative: 96.79999999999995 
Neutral: 1936 6 


لذلك یمکننا أن نری أن الايجابي والمحاید Hel‏ من 1000 حيث یکون السلبي آقل من 100. 
وهذا يعني آن معظم عملاء Amazon Alexa‏ راضون عن خدمانها. 

الملخص 

هذه هي الطريقة التي یمکننا بها تحلیل مشاعر مراجعات Amazon Alexa‏ باستخدام لغة برمجة 
بايثون. یوجد حالیّا آکثر من 40 ملیون مستخدم ل Alexa‏ حول العالم لذا فإن تحلیل مشاعر 
المستخدمين حول Alexa‏ سيكون مشروعًا جيد لعلوم البیانات. أتمنى أن تکون قد آحببت هذه 
المقالة حول مهمة تحليل اراء Amazon Alexa‏ باستخدام بايثون. 


المصدر: 


https: //thecleverprogrammer.com/2021/06/12/amazon-alexa-reviews- 


[sentiment-analysis-using-python 


=q 


التنبؤ بالانتخابات الأمريكية باستخدام لغة بایئون 8 


6 التنبؤ بالانتخابات الأمريكية باستخدام لغة بایئون Predict US‏ 
Elections with Python‏ 

في هذه المقالةء سأطلعك على LAS‏ التنبو بالانتخابات الرئاسية الأمريكية باستخدام بايثون. هناء 
لن أقوم بتدريب أي نموذج للتعلم الالي. سوف آقوم بتحليل مشاعر الناس تجاه المرشحين وبعد 
ذلكفي النهايةء سأختتم ely‏ على أكبر عدد من التغريدات الإيجابية والسلبية ضد المرشحين. 


تم جمع مجموعات البيانات التي أستخدمهاني هذه المهمة للتنبؤ بالانتخابات الأمريكية من 
Twitter‏ بواسطة تويتر Low JI twitter handles Jule‏ لدونالد ترامب وجو بايدن. يمكنك 
تنزيل مجموعات البيانات التى أستخدمها من هنا. 


التنبؤ بالانتخابات الأمريكية باستخدام لغة بايثون 
الآن دون إضاعة أي وقت. فلنبداً بهذه المهمة للتنبؤ بالانتخابات الأمريكية باستخدام بايثون عن 
طريق استيراد المكتبات ومجموعات البيانات اللازمة: 


import pandas as pd 

import numpy as np 

import seaborn as sns 

import matplotlib.pyplot as plt 
from textblob import TextBlob 
from wordcloud import WordCloud 
import plotly.graph objects as go 
import plotly.express as px 


trump reviews = pd.read csv("Trumpall2.csv") 
baiden reviews! = PI read csv ) ۳5۶ 016۳09۲2۰ csv") 


دعنا الآن نلقی نظرة سريعة على الصفوف الخمسة الأولى من مجموعتی البیانات: 


print (trump reviews .head() ) 
print (biden reviews . 820 )( ) 


user text 
e manny rosen  ()sanofi please tell us how many shares the Cr... 
1 osi abdul  https://t.co/atM98CpqF7 Like, comment, RT ۰ 
2 Patsyrw Your AG Barr is as useless & corrupt as y... 
3 seyedebrahimi m Mr. Trump! Wake Up! Most of the comments bel... 
4 James09254677 After 4 years you think you would have figure... 
user text 
9  MarkHodder3 @JoeBiden And we?ll find out who won in 2026... 
T K87327961G @JoeBiden Your Democratic Nazi Party cannot be... 
2 OldlaceA @JoeBiden So did Lying Barr 
3 penblogger @JoeBiden It's clear you didnt compose this tw... 
4 Aquariane264 @JoeBiden I will vote in person thank you. 
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تحلیل المشاعر 
الآنء سأبدأ بتحلیل المشاعر. سأفعل ذلك باستخدام حزمة GTextblob‏ بایشون. سأستخدم هنا 
هذه الحزمة لأداء تصنیف بسيط للنص ما Glen!‏ أو سلبيًا على آساس تحلیل المشاعر: 
textblobl = TextBlob(trump reviews["text"][10])‏ 
print ("Trump :",textblobl.sentiment)‏ 


textblob2 = TextBlob(biden reviews ["text"] [500] ) 
print ("Biden :",textblob2.sentiment) 


Trump : Sentiment(polarity=0.15, subjectivity=0.3125) 
Biden : Sentiment(polarity=0.6, subjectivity=0.9) 
def find pol (review): 

return TextBlob (review) .sentiment.polarity 
trump reviews["Sentiment Polarity"] = 
trump reviews ["text"].apply (find pol) 
print (trump reviews.tail()) 


biden reviews["Sentiment Polarity"] = 
biden reviews ["text"] .apply (find pol) 
print (biden reviews.tail()) 


user ... Sentiment Polarity 

2783 4diva63 ۰ 0.000 
2784 hidge826 ... 0.000 
2785 SpencerRossy ... 0.225 
2786 ScoobyMcpherson ... 6.66 
2787 bjklinz ... -0.500 

user ... Sentiment Polarity 
2535 meryni1977 ... 0.15 
2536 250۳0114 ... 0.00 
2537 KenCapel ... 0.00 
2538  LeslyeHale ... 0.10 
2539 rerickre ۰ 0.20 


الآن قبل المضي قدمّاء دعونا نفهم ما هو القطبية Polarity‏ تتراوح القطبية من -1 إلى +1 
(سلبي إلى إيجابي) وتخبر ما إذا كان النص يحتوي على مشاعر سلبية أو مشاعر ايجابية. تخبر 
القطبية عن المعلومات الواقعية. 


استقطاب المشاعر على كلا المرشحین: 
الآن سأضيف dow‏ جديدةفي LS‏ مجموعتي البیانات باسم "Expression Label"‏ 


trump reviews["Expression Label"] = 

np.where(trump reviews["Sentiment Polarity"]>0, "positive", 
"negative") 
trump reviews ["Expression Label"] [trump reviews ["Sentiment 
Polarity"]==0]="Neutral" 
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print (trump reviews.tail()) 


biden reviews["Expression Label"] = 
np.where (biden reviews["Sentiment Polarity"]>0, "positive", 


"negative") 
biden reviews["Expression Label"] [trump reviews ["Sentiment 
Polarity"]==0]="Neutral" 


print (biden reviews.tail()) 


الآن سأقوم blink‏ جمیع التغریدات ذات القطبية المحايدة من مجموعتي البیانات لموازنة 
البیانات بالتساوي. سأقوم Cal‏ ببعض عملیات تنظیف البیانات حتی نتمکن من التنبق بسهولة 
بالانتخابات الأمريكية: 


reviewsl = trump reviews[trump reviews['Sentiment Polarity'] 
== 0.0000] 
print (reviewsl.shape) 


condi-trump reviews['Sentiment 
Polarity'].isin(reviewsl['Sentiment Polarity']) 

trump reviews.drop(trump reviews[condl].index, inplace = True) 
print(trump reviews.shape) 


reviews2 = biden reviews[biden reviews['Sentiment Polarity'] 
<< 0.0000] 
print (reviews2.shape) 


cond2-biden reviews['Sentiment 
Polarity'].isin(reviewsl['Sentiment Polarity']) 

biden reviews.drop(biden reviews[cond2].index, inplace - True) 
print(biden reviews.shape) 


الآنء قبل المضي قدمّاء نحتاج إلى موازنة مجموعتي البیانات: 


# Donald Trump 

np.random.seed(10) 

remove n =324 

drop indices - np.random.choice(trump reviews.index, remove n, 
replace-False) 

df subset trump = trump reviews.drop(drop indices) 
print(df subset trump.shape) 

# Joe Biden 

np.random.seed(10) 

remove n =31 

drop indices - np.random.choice(biden reviews.index, remove n, 
replace-False) 

df subset biden - biden reviews.drop(drop indices) 

print(df subset biden.shape) 


الآن byes‏ نحلل البيانات للتنبو بالانتخابات الأمريكيةء من خلال تحلیل عدد المشاعر الايجابية 
والسلبيةني كلا الحسابین: 


count 1 = df subset trump.groupby('Expression Label') .count )( 
print (count_1) 


negative perl = (count_1['Sentiment Polarity'][0]/1000)*10 
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positive perl = (count_1['Sentiment Polarity'][1]/1000) *100 
count 2 = df subset biden.groupby('Expression Label J .count )( 
print (count 2) 

negative per2 = (count 2['Sentiment Polarity'] [0]/1000) *100 
positive per2 = (count 2['Sentiment Polarity'][1]/1000) *100 
Politicians = ['Joe Biden', 'Donald Trump'] 

Iis POS = ] 26552625025 Perl, سا ده‎ Perz] 


lis neg = [negative perl, negative per2] 


fig = go.Figure (data=[ 
SO Ba (name Positiva, XPOS ETE aS, ادا‎ OS), 
go.Bar(name-'Negative', x-Politicians, y-lis neg) 


J) 


# Change the bar mode 
fig.update layout (barmode-'group') 
fig.show() 


E Positive 
WE Negative 


50 
40 
30 
20 
10 
à ۳ 


Joe Biden Donald Trump 


من الشکل أعلاه. من الواضح جد أن جو بایدن يحصل على تغريدات أكثر ايجابية وتغريدات 
أقل سلبية مقارنةً بدونالد ترامب. لذلك لن يكون من الخطأ استنتاج أن جو بايدن يفضله الناس 


آکثر من دونالد ترامب للفوزق الانتخابات الرثاسية الأمريكية. 


آتمنی أن تکون قد أحبيت هذا المقال حول LES‏ توقع الفائزني الانتخابات الأمريكية. 
التحلیل كليا على بیانات تویتر. 


المصدر: 


یعتمد 


https://thecleverprogrammer.com/2020/10/01 /predict-us-elections- 


/with-python 
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Hate Speech Detection نموذج اکتشاف خطاب الکراهية‎ (17 
Model 

agit‏ مصطلح خطاب الكراهية hate speech‏ على أنه أي نوع من آنواع الاتصال اللفظي أو 
الكتابي أو السلوكي الذي يهاجم أو یستخدم لغة مهينة أو تمييزية ضد شخص أو مجموعة بناء 
على ماهيتهم. وبعبارة ag ST‏ على أساس دينهم أو عرقهم أو جنسيتهم أو عرقهم. اللون أو النسب 
أو الجنس أو عامل هوية GST‏ هذه المقالته سأطلعك على نموذج اكتشاف خطاب الكراهية 
باستخدام التعلم الآلي وبايثون. 

يعد اكتشاف خطاب الكراهية عمومًا مهمة تصنيف المشاعر .sentiment classification‏ 
لذلك بالنسبة للتدریب» يمكن تحقيق نموذج يمكنه تصنيف خطاب الكراهية من جزء معين من 
النص من خلال تدريبه على بيانات تُستخدم عمومًا لتصنيف المشاعر. لذلك بالنسبة لمهمة 
نموذج الكشف عن خطاب الكراهية. سأستخدم بيانات Twitter‏ 


نموذج اكتشاف خطاب الكراهية 

تتكون مجموعة البيانات التي سأستخدمها لنموذج الكشف عن الكلام الذي يحض على الكراهية 
من مجموعة اختبار وتدريب. تتضمن الحزمة التدريبية قائمة من 31962 تغريدة» ومعرف مطابق 
وعلامة 0 أو 1 لكل تغريدة. الشعور الخاص الذي نحتاج إلى اكتشافهني مجموعة البيانات هذه 
هو ما إذا كانت التغريدة تستند إلى خطاب الكراهية أم لا. يمكنك تنزيل مجموعة البيانات من 
هنا. 


لذاء فلنبدأ بمهمة بناء نموذج لاكتشاف خطاب الكراهية. سأبدأ ببساطة بقراءة مجموعات البيانات 
باستخدام حزمة Pandas‏ لغة بايثون: 


import pandas as pd 

train = Bd read Cev (i Ereim CSV) 

print ("Training Set:"% train.columns, train.shape, len(train) ( 
tosis = OC. eel sw (FEENEY) 

print ("Test Set:"% test.columns, test.shape, len(test) ) 


Training Set: (31962, 3) 31962 
Test Set: (17197, 2) 17197 


تنظیف البیانات 

تنظیف البیانات Data cleaning‏ هو عملية إعداد البیانات المنسقة بشکل غير صحیح للتحلیل 
عن طریق حذف أو تعدیل البیانات المنسقة بشکل غير صحیح والتي لا تکون ضرورية أو مفيدة 
بشکل عام لتحلیل البیانات. حيث یمکن أن تعیق العملية أو تقدم نتائج غير دقيقة. الآن سأقوم 
بعملية تنظیف البیانات باستخدام مکتبة Gre‏ بایثون: 


Julai‏ المشاعر: عن طريق الامثلة 
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import re 
def elesem EE (OE, ol ELELE) B 


Gliese _ 12 لقانت‎ = Che EOE املع‎ sse LOME 
df[text field] = df[text field] .apply(lambda elem: 
re.sub(r" (@ [A-Za-z0-9]+) | ([^0-9A-Za-z 
Wel) | ) لس‎ e S/N SR) | sete را‎ he, UW. cien) 


return df 
ceert Clean = elean were (test, Viennese) 
train clean = clean text(train, "tweet") 


معالجة البيانات غير المتوازنة لنموذج اکتشاف خطاب الكراهية 

إذا كنت ستحلل بعمق المهمة التي نعمل علیها مع سياق البیانات التي نستخدمها. فستجد أن 
التغریدات المتعلقة بخطابات الكراهية أقل نسبیّا من غيرهاء لذا فهذه حالة من البیانات غير 
المتوازنة .unbalanced data‏ 

إذاكنا سنلائم هذه البیانات لتدریب نموذج الکشف عن خطاب الكراهية. فلن یعمم النموذج أي 
خطاب يحض على الكراهية OY‏ البیانات ذات السیاق لخطاب الكراهية آقل بکثیر من البیانات 
الايجابية. لذلك‌في هذه الحالة نحتاج إلى إعداد البیانات لتلائم نموذجنا بشکل صحیح. 

هناك عدد من الطرق التي يمكنك استخدامها للتعامل مع هذا. یتمثل أحد الأساليبفي استخدام 
ما الإفراطفي أخذ العینات oversampling‏ أو الاخترال downsampling‏ .4( حالة الإفراطني 
أخذ العینات. نستخدم دالة تقوم بشکل متکرر بأخذ عینات. مع الاستبدال من BB‏ الاقلية 
minority class‏ حتی یصبح الفئة بنفس حجم الاغلبية. دعونا نری كيف یمکننا التعامل مع 


هذا: 
from sklearn.utils import resample‏ 
train majority = train clean[train clean. label==0]‏ 
train minority = train clean[train clean. label==1]‏ 
train minority upsampled - resample(train minority,‏ 
replace-True,‏ 
n samples-len(train majority),‏ 
random state-123)‏ 
train upsampled - pd.concat([train minority upsampled,‏ 
train majority])‏ 
train upsampled['label'].value counts ()‏ 
29720 1 
29720 0 
Name: label. dtvpe: int64‏ 
از ^ JI Jl zl‏ 


لتبسیط نموذج اکتشاف خطاب الکراهية وامكانية إعادة إنتاجه. سأستخدم مسار Scikit-Learn‏ 


from sklearn. featur xtraction.text import TfidfVectorizer 


from sklearn.pipeline import Pipeline 


go‏ اكتشاف خطاب الكراهية 


from sklearn. featur xtraction.text import CountVectorizer 


from sklearn.feature extraction.text import TfidfTransformer 
from sklearn.linear model import SGDClassifier 
josgoxedbsus e ری‎ c Ee LIne (lt 

xec El, COUMEVEC ESE ZE E O y 

)' 8 عن دع‎ ۰ 12 116 d 15ت ع‎ COMECON 

) 119 ۲, SGI Gas sistens (pap 


تدریب نموذج اکتشاف خطاب الكراهية 
الآنء قبل تدریب النموذج دعنا نقسم البیانات إلى مجموعة تدریب ومجموعة اختبار: 
erein test Sollt‏ اه تا model selection‏ وت للك E OM‏ 


X EAI X ieu, y CEI, y TeSt = 
train test split(train upsampled['tweet'], 


train upsampled['label'],random state - 0) 


الآن Les‏ ندرب النموذج ونتوقع النتائج على مجموعة الاختبار باستخدام طريقة score‏ ۳1: 


model = pipeline ند‎ rie crenn, VM سدع‎ EIE) 
y predict = model.predict(X test) 

from sklearn.metrics import fl score 

E Beore MI test, y Dediet) 


0.9696 
لذلك حصانا على درجة ۴1 بنسبة G0.96‏ المائة وهو آمر یستحق التقدیر بشكل ple‏ یمکن OW‏ 
نشر هذا النموذج واستخدامه‌ني الإنتاج. أتمنى أن تکون قد آحببت هذه المقالة حول نموذج 
اکتشاف خطاب الكراهية باستخدام التعلم الالي. لا تترددفي طرح أسئلتك القيمةفي قسم 
التعلیقات آدناه. 

المصدر: 
https: //thecleverprogrammer.com/2020/08/19/hate-speech-detection-‏ 


/model 
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18( تحلیل المشاعر على تویتر Twitter Sentiment Analysis‏ 

تحلیل المشاعر على Twitter‏ هو عملية تحدید وتصنیف التغریدات بشکل حسابي في جزء من 
التص. لا سیما من أجل تحدید ما إذا كان موقف الکاتب تجاه موضوع أو منتج معین. وما إلى 
ذلك إيجابيًا أم el Glo‏ محایدا. 


في هذه المقالة سأقوم بتحلیل المشاعر على تویتر باستخدام المعالجة اللغوية الطبيعية Natural‏ 
Language Processing‏ باستخدام مکتبة nltk‏ مع بايثون. 


تحلیل المشاعر على تویتر 
استیراد المکتبات: 


import numpy as np # linear algebra 

import pandas as pd # data processing, CSV file I/O (e.g. 
pd.read csv) 

from sklearn.model selection import train test split # 
function for splitting data to train and test sets 


import nltk 
from nltk.corpus import stopwords 
from nltk.classify import SklearnClassifier 


from wordcloud import WordCloud,STOPWORDS 
import matplotlib.pyplot as plt 


تنزیل مجموعة البیانات: 


data = pd.read_csv('Sentiment.csv') 
#Keeping only the neccessary columns 
data = data[['text','sentiment']] 


بادئ ذي بذع 25 تقسیم مجموعة البیانات إلى مجموعة تدریب واختبار. مجموعة الاختبار هي 710 
من مجموعة البيانات الأصلية. 


بالنسبة لهذا التحليل الخاص. أسقطت التغريدات المحایدة. حيث كان هدفى هو التمییز بين 
التغريدات الإيجابية والسلبية فقط. 
#Splitting the dataset into train and test set‏ 
test size = (0.3)‏ 42237 ) ع هي Ea in, TeS = train test‏ 


#Removing neutral sentiments 
train = train[train.sentiment != "Neutral"] 


كخطوة IL‏ قمت بفصل التخریدات الايجابية والسلبية لمجموعة التدریب من أجل تصوير 
الکلمات المضمنة بسهولة. 


بعد ذلك قمت بتنظیف النص من علامات التصنیف والاشارات والروابط. آصبحوا OW‏ جاهزین 
لتصویر WordCloud‏ الذي یعرض فقط الکلمات الا کثر تا کید للتغريدات الايجابية والسلبية. 


۳ لي J‏ شاعر: عن طريق الا li‏ 


Treun POS rasta Sene |] == Positive" | 
erenn POS = EFA اوه‎ Ee | 
Ea in med = وتا‎ ceini senti ieat] == Negative] 


traim meg = erein egisse | 


def wordcloud draw(data, color = 'black'): 
words = ' '.join(data) 
cleaned word = " ".join([word for word in words.split() 


ie Sheep. MOE im MOEA 
and not word.startswith('@') 
and not word.startswith('#') 
and word != 'RT' 


wordcloud = WordCloud(stopwords=STOPWORDS, 

background_color=color, 
width=2500, 
height=2000 

s generate (cleaned word( 

.figure(1,figsize=(13, 13)) 

.imshow (wordcloud) 

gts ( EXE ( 

.Show() 


TU, v, 
BONA 


print("Positive words") 

wordcloud draw(train pos,'white') 
print("Negative words") 

wordcloud draw(train neg) 
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تحلیل المشاعر على تویتر 
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من المثیر للاهتمام ملاحظة الکلمات والعبارات التاليةفي مجموعة الکلمات الایجابیة: «truth‏ 
job «love «together legitimate «strong‏ 
في تفسيري یمیل الناس إلى الاعتقاد ob‏ مرشحهم المثالي صادق وشرعي وفوق الخیر والشر. 


news «influence في الوقت نفسه. تحتوي التغریدات السلبية على کلمات مثل:‎ 
.trying «cherry picking «makeup «softball «disappointing ۰ Elevatormusic 


bore 
التدريب.‎ 


كلمات Stop Words gl‏ : هي الكلمات التي لا تحتوي على أهمية مهمة لاستخدامهاني 
استعلامات البحث. 

ble‏ ما يتم تصفية هذه الکلمات من استعلامات البحث لأنها ترجع 53 هائلاً من المعلومات 
غير الضرورية. «this for the)‏ الخ.) 


al‏ المشاعر: عن طريق الامثلة 
tweets =[]‏ 


stopwords set = set (stopwords.words ("english") ) 


for index, row in train.iterrows: () 


ae eee! = [e loner) zor € iin mew Test golire) ake‏ ول 
len(e) >= 3]‏ 
words cleaned = [word for word in words filtered‏ 


aie Visite! MO im WOES 
and not word.startswith('@') 
and not word.startswith('#') 
and word != 'RT[' 
words without stopwords = [word for word in words cleaned 
if not word in stopwords set] 
tweets.append((words without stopwords, row.sentiment)) 


ESSE POS = rest testi SeNEIMeRE I | == ۱ 552 ۵ ] 
TeSt BOS = Lose DoS testi] 
test meg = CSEL test" sentinent] == Negative" ] 


test_neg = test_n Gl eese V 1‏ 
كخطوة AIL‏ قمت باستخراج المیزات المسماة باستخدام nltk lib‏ أولاً عن طريق قياس 
التوزیع المتکرر واختیار المفاتیح الناتجة. 


#Extracting word features 

def get words in tweets (tweets): 
211|[ = 
for (words, sentiment) in tweets: 


all.extend (words) 
return all 


def get word features (wordlist): 
wordlist = nltk.FreqDist (wordlist) 
features = wordlist.keysQ 


return features 
w features = get word features(get words in tweets (tweets) ) 


def extract features (document): 
document words = set(document) 
features{} = 


for word in w features: 


9. 


features['contains($s)' $ word] - (word in document words) 
return features 


بموجب هذا قمت برسم الکلمات الأكثر انتشارًا. تترکز معظم الکلمات حول ليالي النقاش 
debate nights‏ 


wordcloud draw(w features) 
قمت بتصنیف میزات کلمات التغريدة‎ «nltk NaiveBayes Classifier باستخدام‎ 


المستخرجة. 


#Training the Naive Bayes classifier 
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training get = 
nltk.classify.apply features(extract features,tweets) 
classifier - nltk.NaiveBayesClassifier.train(training set) 


آخیرا. باستخدام مقاییس غير ASS‏ حاولت قياس LAS‏ تسجیل خوارزمية المصنف. 


meg cine = 0 
BOs cme MO 
EOE (gie skid test کل‎ 
ies < Classe Classi ryle trece عهفداط اههد‎ KOS SPIE زر زر(‎ 
if(res == 'Negative'): 
MEG CME = MEC ine r di 
OE (ion iM TESE OOS: 
mes = وی مج نط تعووت‎ SSE VEKE EACE 229 601296 (O psit) )))) 


if(res == 'Positive'): 
BOS عست‎ = OOS CME ar il 


print (' [Negative]: 59/55 ' 5 (len(test neg),neg cnt) ) 
print ('[Positive]: $s/$s ' = (len(test pos),pos cnt) ) 


1 [Negative]: 842/795 
2 [Positive]: 220/74 


المصدر: 


https: //thecleverprogrammer.com/2020/06/13/twitter-sentiment- 


/analysis 
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19( تحلیل مراجعات الفیلم Movie Reviews Sentiment Analysis‏ 
في مشروع التعلم الالي هذاء سننشی GUS Goad‏ يضع نصوص مراجعات الأفلامني إحدى 
فئتين- المشاعر السلبية أو الإيجابية. سنلقي نظرة سريعة على نظرية Bayes theorem yh‏ 

ونخفف متطلباتها باستخدام افتراض نايف -Naive assumption‏ 


لنبدأ باستيراد المكتبات: 


import numpy as np # linear algebra 

import pandas as pd # data processing, CSV file I/O (e.g. 
pd.read csv) 

import re 4 for regex 

ELON DILEK COEOUS EMOOEE SEODWOEAS 

from nltk.tokenize import word tokenize 

from nltk.stem import SnowballStemmer 

from sklearn.feature extraction.text import CountVectorizer 
E rom Skler model selection imoore erei test solie 
from sklearn.naive bayes import 

GaussianNB, MultinomialNB, BernoulliNB 

from sklearn.metrics import accuracy score 


import pickle 
يمكنك تنزیل مجموعة البیانات التی تحتاجها لهذه المهمة من هنا:‎ 


IMDB-Dataset Download DataSEt 


data = pd.read csv('IMDB Dataset.csv') 
print (data. shape) 


data.head () 
review sentiment 
0 One of the other reviewers has mentioned that ... positive 
1 A wonderful little production. <br /><br />The... positive 
2 | thought this was a wonderful way to spend ti... positive 
3 Basically there's a family where a little boy ... negative 
4 Petter Mattei's "Love in the Time of Money" is... positive 


data.info() 


TIME 


1 #0utput 


۲ اه 


3 RangeIndex: 50000 entries, 0 to 49999 


4 Data columns (total 2 columns): 


5 # Column Non-Null Count Dtype 
6 --- ------ --------------  ----- 
7 0 review 50000 non-null object 
8 1 sentiment 50000 non-null object 
9 dtypes: object(2) 


10 memory usage: 781.44 KB 


لا توجد قیم فارغة. قم بترمیز تسمية Label encode‏ المشاعر إلى 1 (موجب) و 0 (سلبي): 


sentiment.value counts )( 


data. 


1 #Output 
2 positive 25000 
3 negative 25000 
4Name: sentiment, dtype: int64 


sentiment.replace('positive',1,inplace=True) 
sentiment.replace('negative',0,inplace=True) 


sentiment 


6 o 


head (10) 


review 


One of the other reviewers has mentioned that ... 
A wonderful little production. «br /><br />The... 

| thought this was a wonderful way to spend ti... 
Basically there's a family where a little boy ... 
Petter Mattei's "Love in the Time of Money" is... 
Probably my all-time favorite movie, a story o... 

| sure would like to see a resurrection of a U... 
This show was an amazing, fresh & innovative i... 
Encouraged by the positive comments about this... 


If you like original gut wrenching laughter yo... 


review[0] 


data. 
data. 
data. 


0 


= 


data. 


— 
#Output 


One of the other reviewers has mentioned that after watching 
just 1 Oz episode you'll be hooked. They are right, as this is 
exactly what happened with me.<br /><br />The first thing that 
struck me about Oz was its brutality and unflinching scenes of 
violence, which set in right from the word GO. Trust me, this 
is not a show for the faint hearted or timid. This show pulls 
no punches with regards to drugs, sex or violence. Its is 
handcone, m the classic use or the word: <br ><br- he 1S 
called OZ as that is the nickname given to the Oswald Maximum 
Security State Penitentary. It focuses mainly on Emerald City, 
an experimental section of the prison where all the cells have 
glass fronts and face inwards, so privacy is not high on the 
agenda. Em City is home to many..Aryans, Muslims, gangstas, 

Meisn ANS MO Soano SO SCV eS,‏ هو ره تاره دی INOS‏ عت سا 
death stares, dodgy dealings and shady agreements are never‏ 
far away.<br /><br />I would say the main appeal of the show‏ 
is due to the fact that it goes where other shows wouldn't‏ 
dare. Forget pretty pictures painted for mainstream audiences,‏ 
forget charm, forget romance...OZ doesn't mess around. The‏ 
first episode I ever saw struck me as so nasty it was surreal,‏ 
I couldn't say I was ready for it, but as I watched more, I‏ 
developed a taste for Oz, and got accustomed to the high‏ 
levels of graphic violence. Not just violence, but injustice‏ 
(crooked guards who'll be sold out for a nickel, inmates‏ 
who'll kill on order and get away with it, well mannered,‏ 
middle class inmates being turned into prison bitches due to‏ 
their lack of street skills or prison experience) Watching Oz,‏ 
you may become comfortable with what is uncomfortable‏ 


viewing....thats if you can get in touch with your darker side. 
خطوات لتنظیف المراجعات:‎ 
-Remove HTML tags HTML ازالة علامات‎ 1 


-Remove special characters إزالة الأحرف الخاصة‎ 2 


3. تحویل کل شیء إلى احرف صغيرة .Convert everything to lowercase‏ 
4 إزالة کلمات التوقف .Remove stopwords‏ 


.Stemming التجذیع‎ 5 


HTML علامات‎ Jl jl 1 
def clean(text): 

cleaned = re.compile(r'«.*?»') 

return re.sub(cleaned,'',text) 


data.review = data.review.apply (clean) 
data.review[0] 
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co 
درم‎ 


#Output 


"One of the other reviewers has mentioned that after watching 
just 1 Oz episode you'll be hooked. They are right, as this is 
exactly what happened with me.The first thing that struck me 
about Oz was its brutality and unflinching scenes of violence, 
which set in right from the word GO. Trust me, this is not a 
show for the faint hearted or timid. This show pulls no punches 
with regards to drugs, sex or violence. Its is hardcore, in the 
classic use of the word.It is called OZ as that is the nickname 
given to the Oswald Maximum Security State Penitentary. It 
focuses mainly on Emerald City, an experimental section of the 
prison where all the cells have glass fronts and face inwards, 
SO privacy is not high on the agenda. Em City is home to 
many..Aryans, Muslims, gangstas, Latinos, Christians, Italians, 
Irish and more....so scuffles, death stares, dodgy dealings and 
shady agreements are never far away.I would say the main appeal 
of the show is due to the fact that it goes where other shows 
wouldn't dare. Forget pretty pictures painted for mainstream 
audiences, forget charm, forget  romance...OZ2 doesn't mess 
around. The first episode I ever saw struck me as so nasty it 
was surreal, I couldn't say I was ready for it, but as I watched 
more, I developed a taste for Oz, and got accustomed to the high 
levels of graphic violence. Not just violence, but injustice 
(crooked guards who'll be sold out for a nickel, inmates who'll 
kill on order and get away with it, well mannered, middle class 
inmates being turned into prison bitches due to their lack of 
street skills or prison experience) Watching Oz, you may become 
comfortable with what is uncomfortable viewing....thats if you 


can get in touch with your darker side’. 
ازالة الأحرف الخاصة‎ .2 
def و1‎ spectas texte) 
rem'' = 
EOE 3L 111 OEE 
LE SARUM (()) 
rem = rem + i 
else: 
rem = rem' ' + 
return rem 


data.review = data.review.apply(is special) 
data.review[0] 


#Output 


"One of the other reviewers has mentioned that after watching 
just 1 Oz episode you 11 be hooked They are right as this is 
exactly what happened with me The first thing that struck me 
about Oz was its brutality and unflinching scenes of violence 
which set in right from the word GO Trust me this is not a 
show for the faint hearted or timid This show pulls no punches 
with regards to drugs sex or violence Its is hardcore in the 
classic use of the word It is called OZ as that is the nickname 
given to the Oswald Maximum Security State Penitentary IE 
focuses mainly on Emerald City an experimental section of the 


bho تحليل‎ 


prison where all the cells have glass fronts and face inwards 
SO privacy is not high on the agenda Em City is home to many 
Aryans Muslims gangstas Latinos Christians Italians Irish 
and more so scuffles death stares dodgy dealings and shady 
agreements are never far away I would say the main appeal of the 
show is due to the fact that it goes where other shows wouldn t 
dare Forget pretty pictures painted for mainstream audiences 
forget charm forget romance OZ doesn t mess around The first 
episode I ever saw struck me as so nasty it was surreal I couldn 
t say I was ready for it but as I watched mor I developed a 
taste for Oz and got accustomed to the high levels of graphic 
violence Not just violence but injustice crooked guards who 
ll be sold out for a nickel inmates who 11 kill on order and 
get away with it well mannered middle class inmates being 
turned into prison bitches due to their lack of street skills or 
prison experience Watching Oz you may become comfortable with 
what is uncomfortable viewing thats if you can get in touch 
with your darker side ' 


3. تحویل کل شيء إلى آحرف صغيرة 
der EO lower (tenth s‏ 
return text. lower )(‏ 


data.review = data.review.apply(to lower) 
data. review([0] 


#Output 


"one of the other reviewers has mentioned that after watching 
just 1 oz episode you 11 be hooked they are right as this is 
exactly what happened with me the first thing that struck me 
about oz was its brutality and unflinching scenes of violence 
which set in right from the word go trust me this is not a 
show for the faint hearted or timid this show pulls no punches 
with regards to drugs sex or violence its is hardcore in the 
classic use of the word it is called oz as that is the nickname 
given to the oswald maximum security state penitentary aE 
focuses mainly on emerald city an experimental section of the 
prison where all the cells have glass fronts and face inwards 
so privacy is not high on the agenda em city is home to many 
giryona mMmuslins GARI SEAS اه نت لو ورن اه ای وا‎ 
and more so scuffles death stares dodgy dealings and shady 
agreements are never far away i would say the main appeal of the 
show is due to the fact that it goes where other shows wouldn t 
dare forget pretty pictures painted for mainstream audiences 
forget charm forget romance oz doesn t mess around the first 
episode i ever saw struck me as so nasty it was surreal i couldn 
t say i was ready for it but as i watched mor i developed a 
taste for oz and got accustomed to the high levels of graphic 
violence not just violence but injustice crooked guards who 
ll be sold out for a nickel inmates who 11 kill on order and 
get away with it well mannered middle class inmates being 
turned into prison bitches due to their lack of street skills or 
prison experience watching oz you may become comfortable with 
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what is uncomfortable viewing thats if you can get in touch 
with your darker side' 


4. إزالة کلمات التوقف 
def rem stopwords (text):‏ 
stop words = set(stopwords.words('english'))‏ 


words = word tokenize (text) 
return [w for w in words if w not in stop words] 


data.review = data.review.apply(rem stopwords) 
data.review[0] 


5. جذع الکلمات 


def SES Eee (ext) 
ss = SnowballStemmer('english') 
تا عدص‎ UU Maes (SS SECMW) EOE wr alia EI) 


data.review = data.review.apply(stem txt) 
data.review[0] 


data.head() 
review sentiment 
0 one review mention watch 1 oz episod hook righ... 1 
1 wonder littl product film techniqu unassum old... 1 
2 thought wonder way spend time hot summer weeke... 1 
3 basic famili litt] boy jake think zombi closet... 0 
4 petter mattei love time money visual stun film... 1 

انشاء النموذج 


Bag Of Words (BOW) انشاء حقببة الکلمات‎ .1 


X = np.array(data.iloc[:,0].values) 

y = np.array(data.sentiment.values) 

cv = CountVectorizer(max features = 1000) 

X = cv.fit_transform(data.review) .toarray () 


print ("X.shape = ",X.shape) 
print ("y.shape = ",y.shape) 
1 #Output 


2 X. shape (50000, 1000) 
3y.shape = (50000, ) 


co 
ol 
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print (X) 


#Output 

array([[0, 0, 0, ..., 0, 0, 0], 
[0, 0, 0, ..., 0, 0, 0], 
[0, 0, 0, ..., 0, 1, 0], 
z6 
[0, 0, 0, ..., €, 0, 0], 
[05 8 1; soos 0, 06, 0], 
[0, 0, ©, ..., ©, ©, 0]]) 


2. تقسيم تدريب /اختبار 


trainx,testx,trainy,testy - 

train test split(X,y,test size-0.2,random state-9) 
print("Train shapes : X = {}, y= 

{}".format (trainx.shape,trainy.shape) ) 

prine Teste shapes : MI TEE 
()".format(testx.shape,testy.shape)) 


1 #Output 
2 Train shapes : X - (40000, 1000), y - (40000,) 
3Test shapes : X - (10000, 1000), y - (10000,) 


3. تعریف النماذج والتدریب علیها 


#Output 
BernoulliNB(alpha-1.0, binarize-0.0, class prior=None, 
اجان را‎ Terbi) 


4 مقاييس التنبق والدقة لاختیار النموذج الأفضل 
ypg = gnb.predict (testx)‏ 


ypm = mnb.predict (testx) 
ypb = bnb.predict (testx) 
print ("Gaussian = ",accuracy score (testy,ypg)) 
print("Multinomial = ",accuracy score (testy,ypm)) 
۵ ۳۱۵۱ acea vlsicomeieie ع‎ ) 

1 #Output 


2 Gaussian = 0.7843 
3Multinomial = 0.831 
4 Bernoulli = 0.8386 


pickle.dump (bnb,open('modell.pkl','wb')) 


rev = """Terrible. Complete trash. Brainless tripe. Insulting 
to anyone who isn't an 8 year old fan boy. Im actually pretty 
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co 
N 


disgusted that this movie is making the money it is - what does 
it say about the people who brainlessly hand over the hard earned 
cash to be 'entertained' in this fashion and then come here to 
leave a positive 8.8 review?? Oh yes, they are morons. Its the 
only sensible conclusion to draw. How anyone can rate this movie 
amongst the pantheon of great titles is beyond m 


So trying to find something constructive to say about this title 
is hard...I enjoyed Iron Man? Tony Stark is an inspirational 
character in his own movies but here he is a pale shadow of 
that...About the only 'hook' this movie had into me was wondering 
when and if Iron Man would knock Captain America out...Oh how I 
wished he had :( What wer thes other characters anyways? 
Useless, bickering idiots who really couldn't organise happy 
times in a brewery. The film was a chaotic mish mash of action 
elements and failed 'set pieces...' 


I found the villain to be quite amusing. 


And now I give up. This movie is not robbing any more of my time 
but I felt I ought to contribute to restoring the obvious fake 
rating and reviews this movie has been getting on IMDb""",. 

f1 = clean (rev) 

E2 = ig SECA E) 

EY = EO LOSE) 

f4 = rem stopwords (£3) 

ES = Gren EEE) 


bow,words = [],word tokenize(f5) 

for word in words: 
bow.append (words. count (word) ) 

#np.array (bow) . reshape (1, 3000) 

#bow. shape 

word dict = cv.vocabulary 

pickle.dump (word dict,open('bow.pkl','wb')) 


[0] 


المصدر: 


https: //thecleverprogrammer.com/2020/05/25/movie-reviews- 


sentiment-analysis-binary-classification-with -machine-learning/ 
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JU تحلیل آراء مراجعات منتجات آمازون باستخدام التعلم‎ 0 
Amazon Product Reviews Sentiment Analysis with Machine 
Learning 

أصبحت مراجعات المنتجات Product reviews‏ أكثر Leal‏ مع تطور متاجر البیع بالتجزئة 
التقليدية من الطوب والملاط إلى التسوق عبر الإنترنت. 


ينشر المستهلكون مراجعاتهم مباشرة على صفحات المنتجنفي الوقت الفعلي. مع الكم الهائل من 
آراء المستهلکین فان هذا يخلق فرصة لمعرفة كيف يتفاعل السوق مع منتج معين. 


سنحاول معرفة ما إذاكان بإمكاننا التنبؤ بمشاعر مراجعة المنتج باستخدام بايثون والتعلم ال لي. 
دعنا نستورد الوحدات الضرورية ونلقي نظرة على البيانات: 
يمكنك تنزيل مجموعة البيانات هذه من هنا. 


import matplotlib.pyplot as 1 

import pandas as pd 

import numpy as np 

import seaborn as sns 

import math 

import warnings 

warnings.filterwarnings('ignore') # Hides warning 
warnings.filterwarnings ("ignore", category-DeprecationWarning) 
warnings.filterwarnings ("ignore",category-UserWarning) 
sns.set style("whitegrid") # Plotting style 
np.random.seed(7) # seeding random number generator 


dE = Bd 90و‎ ۵9 AMAZON ESV) 
print (df.head()) 


id ... reviews.username 


@ AVqkIhwDv8e3D10-lebb ... Adapter 
1 AVqkIhwDv8e3D10O-lebb ... truman 
2 AVqkIhwDv8e3D10-lebb ... DaveZ 
3 AVgkIhwDv8e3D10-lebb... Shacks 
4 AVgkIhwDv8e3D10-lebb ... explore42 


[5 rows x 21 columns] 


وصف مجموعة البیانات 
data = df.copy()‏ 
data. describe ()‏ 
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reviews.id reviews.numHelpful reviews.rating reviews.userCity reviews.userProvince 


0.0 
NaN 


Float64 
float64 
float64 
object 
object 
object 
floate64 
float64 
object 


34627.000000 0.0 


4.584573 
0.735653 
1.000000 
4.000000 
5.000000 
5.000000 
5.000000 


34131.000000 
0.630248 
13.215775 
0.000000 
0.000000 
0.000000 
0.000000 
814.000000 


count 1.0 
mean 0 
std NaN 
min  111372787.0 


111372787.0 
111372787.0 
111372787.0 
111372787.0 


data.info () 


«class 'pandas.core.frame.DataFrame'» 
RangeIndex: 34660 entries, © to 34659 


Non-Null Count 
34660 non-null 
27900 non-null 
34658 non-null 
34660 non-null 
34660 non-null 
34660 non-null 
34660 non-null 
34621 non-null 
24039 non-null 
34660 non-null 
1 non-null 

34066 non-null 
1 non-null 

34131 non-null 
34627 non-null 
34660 non-null 
34659 non-null 
34655 non-null 
6 non-null 

6 non-null 


Data columns (total 21 columns): 
# Column 

6 id 

1 name 

2 asins 

3 brand 

4 categories 

5 keys 

6 manufacturer 

7 reviews.date 

8 reviews .dateAdded 

9 reviews.dateSeen 

10 reviews.didPurchase 
11 reviews.doRecommend 
12 reviews.id 

13 reviews.numHelpful 
14 reviews.rating 

15 reviews.sourceURLs 
16 reviews.text 

17 ۳6۷1۵5 6 

18 reviews.userCity 

19 reviews.userProvince 
26 reviews.username 


34658 non-null 


dtypes: float64(5), object(16) 


5 . 6+ MB 


memory usage: 
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نحتاج إلى تنظیف agor‏ الاسم name column‏ من خلال الرجوع إلى asins‏ (منتجات 
فريدة (unique products‏ نظرًا لأن WY‏ 7000 قيمة مفقودة: 


data["asins"].unique() 


array(['B@1AHB9CN2', 'B@@VINDBIK', 'BO005PB2TOS', 'B002Y27P3M', 
'BelAHBSCYG', 'BO1AHBSCIE', 'B0122G4VBG', 'BO0OZV9PXP2', 
'B0O083QO4TA', 'BO18Y2290U', 'BOOREQKWGA', 'BOeIOYAMAI', 
'BO18T075DC', nan, ۲8۵۵0154" ر‎ 'BO18Y225IA', "8605۴82720" ر‎ 
۱8018۷23000 ر "۰8661029100 ر "89910۷8900 ر "۲8680920310 ر‎ 
۲800030031۷" , 'BO18Y22C2Y', "8۵18۴1881۴" ر‎ 'B0124ORNHU', 
8018527381" ر‎ 'BOOUHAD8G2', ۰8۵18۷22814", 'BOOTSUGXKE', 
"BOOLSEPT80, BO1E6A069U', 'BO18Y23P7K', 'BOOXAWHPSE', 'BOOQFQRELG', 
800۱۷/903" ر‎ 'BOOeQL1ZN3G', 'BO189XYYOeQ', 'BO1BH8300M', 
"BOOBFIAHF8', 'BOOUSFPNAU', 'B002Y27P6Y', "86666۷058" ر‎ 
'BeeeGWo5WK'], dtype=object) 


asins unique - len(data["asins"].unique()) 
print ("Number of Unique ASINs: " + str(asins unique)) 


#Output— Number of Unique ASINs: 42 


تصوير توزیعات المتغیرات العددية: 


data.hist(bins-50, figsize=(20,15) ) 
plt.show() 


reviews.id reviews.numHelpful 


66 68 70 72 0 100 200 300 400 500 600 700 800 


74 
41.1137278e8 


reviews.rating reviews.userCity 


10 15 20 25 30 35 40 45 50 00 02 04 06 08 10 


reviews userProvince 
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تعتبر القیم المتطرفة GOutliers‏ هذه الحالة ذات قيمة. لذلك قد نرغب‌في تقییم التقييمات التي 
تضم آکثر من 50 شخصًا یجدونها مفيدة. 


تم تصنیف غالبية الأمثلة بدرجة عالية (بالنظر إلى توزیع التصنیف). هناك ضعف مقدار 
تصنیفات 5 نجوم من التصنیفات الاخری مجتمعة. 


نقسیم البیانات إلى تدريب واختبار 
قبل أن نستکشف مجموعة البيانات» سنقسمها إلى مجموعة تدریب ومجموعات اختبار. هدفنا 
في النهاية هو تدریب مصنف تحلیل المشاعر. 


نظرًا oY‏ غالبية المراجعات إيجابية (5 نجوم). فسنحتاج إلى اجراء تقسیم طبقي stratified‏ 
split‏ على درجة المراجعات reviews score‏ لضمان عدم تدریب المصنف على البیانات غير 
المتوازنة imbalanced data‏ 


from sklearn.model selection import StratifiedShuffleSplit 
print ("Before {}".format (len (data) ) ) 
dataAfter = data.dropna(subset-["reviews.rating"]) 

#Removes all NAN in reviews.rating 
print ("After {}". format (len (dataAfter) ) ) 
dataAfter["reviews.rating"] = 
dataAfter["reviews.rating"] .astype (int) 


split = 1ت كت 12 2212 2 22ت‎ 2 eol (ia Slices), wee Sues 2) 
OE train سل‎ test مه‎ im split gplir (OE وت‎ ter; 


dataAfter["reviews.rating"]): 
strat train = dataAfter.reindex (train index) 
strat_test = dataAfter.reindex(test_index) 
Before 34660 
After 34627 


بالبیانات الأولية: 


print (len(strat_train) ) 

prame (abeo (Gieteche 625520 

print (strat_test["reviews.rating"].value counts()/len(strat te 
st)) 
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27701 

6926 

5.0 0.689864 
4.0 8.244730 
3.0 0.042160 
1.0 0.011406 
2. 0.011118 


Name: reviews.rating, dtype: float64 


استکشاف البیانات (مجموعة (ujal‏ 
سنستخدم التعابیر المنتظمة expressions‏ 7651112 لتنظيف آي آحرف غير مرغوب dle‏ 
مجموعة البیانات. ثم معاينة الشکل الذي تبدو عليه البیانات بعد التنظیف. 


reviews = strat_train.copy() 
reviews .head () 


id ... Sentiment 


4349 AVphgVaXicnluZ@-DR74 ... Positive 
30776 AV1YE_muvKc47QAVgpwE ... Positive 
28775  AVpidLjVilAPnD xEVpI ... Neutral 
1136  AVqkIhwDv8e3D10-lebb ... Positive 
17803 _ ۵۹ ... Positive 


[5 rows x 22 columns] 


print (len(reviews["name"].unique()), 
len(reviews["asins"].unique())) 

print (reviews.info()) 

print (reviews .groupby ("asins") ["name"].unique )( ( 


float64 
float64 
float64 
object 
object 
object 
float64 
float64 
object 


Wi-Fi Speaker - 


Wi-Fi Speaker - 


تحلیل المشاعر: 


Non-Null Count 
27673 non-null 
22268 non-null 
27672 non-null 
27673 non-null 
27673 non-null 
27673 non-null 
27673 non-null 
27659 non-null 
19228 non-null 
27673 non-null 
1 non-null 

27257 non-null 
1 non-null 

27304 non-null 
27673 non-null 
27673 non-null 
27672 non-null 
27668 non-null 
€ non-null 

€ non-null 

27671 non-null 


io عن طرية‎ 
= Column 
@ id 
1 name 
2 asins 
3 brand 
4 categories 
5 keys 
6 manufacturer 
7 reviews.date 
8 reviews . 0200 
9 reviews ۰ 02165667 


10 reviews.didPurchase 
11 reviews . 0 
12 reviews.id 

13 reviews.numHelpful 
14 reviews.rating 

15 reviews.sourceURLs 
16 reviews.text 

17 reviews.title 

18 reviews.userCity 

19 reviews.userProvince 
20 reviews.username 


dtypes: float64(5), object(16) 


16 Gb, Special Offers - Silver 


16 Gb, Special Offers - Silver 


memory usage: 4.6+ MB 


#Output 
Echo (White) 
Echo (White) 


Amazon Fire Tv 


ووو 


ووو 


Amazon Fire Tv 


nan 

Amazon - Amazon Tap Portable Bluetooth and 
Bae E 

Amazon - Amazon Tap Portable Bluetooth and 
LEE yy 

Amazon Fire Hd 10 Tablet, Wi-Fi, 

Aluminun,,, 

Amazon Fire Hd 10 Tablet, Wi-Fi, 

Aluminun,,, 


Amazon 9W PowerFast Official OEM USB Charger and Power Adapter 


ووو 


for Fire Tablets and Kindle eReaders 
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Amazon 9W PowerFast Official OEM USB Charger and Power Adapter 
for Fire Tablets and Kindle eReaders,,, 

Amazon Kindle Fire 5ft USB to Micro-USB Cable (works with most 
Micro-USB Tablets),,, 

Amazon Kindle Fire 5ft USB to Micro-USB Cable (works with most 
Micro-USB Tablets),,, 

Kindle Dx Leather Cover, Black (fits 9.7 Display, Latest and 2nd 
Generation Kindle Dxs),, 

Amazon Fire Hd 6 Standing Protective Case(4th Generation - 2014 
Release), Cayenne Red,,, 

Amazon Fire Hd 6 Standing Protective Case (4th Generation - 2014 
Release), Cayenne Red,,, 

Amazon Fire Hd 6 Standing Protective Case(4th Generation - 2014 
Release), Cayenne Red,,, 

Amazon 5W USB Official OEM Charger and Power Adapter for Fire 
Tablets and Kindle eReaders,,, 

New Amazon Kindle Fire Hd 9w Powerfast Adapter Charger + Micro 
Usb Angle Cable,,, 
New Amazon Kindle Fire Hd 9w Powerfast Adapter Charger + Micro 
Usb Angle Cable,,, 

Amazon 5W USB Official OEM Charger and Power Adapter for Fire 
Tablets and Kindle eReaders,,, 

Amazon 5W USB Official OEM Charger and Power Adapter for Fire 
Tablets and Kindle eReaders 
Echo (White),,, 

Fire Tablet, 7 Display, Wi-Fi, 8 GB - Includes Special Offers, 


n" 


ووو 


Tangerine’ 
Echo (Black),,, 

Amazon 9W PowerFast Official OEM USB Charger and Power Adapter 
for Fire Tablets and Kindle eReaders 
Echo (Black) 
Echo (Black) 
Amazon Fire Tv,,, 

Kindle Dx Leather Cover, Black (fits 9.7 Display, Latest and 2nd 
Generation Kindle Dxs),, 

New Amazon Kindle Fire Hd 9w Powerfast Adapter Charger -* Micro 
Usb Angle Cable 


ووو 


ووو 


ووو 


ووو 


Echo (White),,,\r\nEcho (White),,, 
2318 
Amazon Fire Tv,,,NrNnAmazon Fire dy 
2029 
Amazon - Amazon Tap Portable Bluetooth and Wi-Fi Speaker - 
Black,,,\r\nAmazon - Amazon Tap Portable Bluetooth and Wi-Fi 
Speaker = BLA np 
259 


Amazon Fire Hd 10 Tablet, Wi-Fi, 16 Gb, Special Offers - Silver 
Aluminum,,,\r\nAmazon Fire Hd 10 Tablet, Wi-Fi, 16 Gb, Special 
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Offers = Silver Aluminum,,, 
106 

Amazon 9W PowerFast Official OEM USB Charger and Power Adapter 
for Fire Tablets and Kindle eReaders,,,\r\nAmazon 9W PowerFast 
Official OEM USB Charger and Power Adapter for Fire Tablets and 
Kindle eReaders,,, 28 

Kindle Dx Leather Cover, Black (fits 9.7 Display, Latest and 0 
Generation Kindle IDPS) م‎ 
7 

Amazon 5W USB Official OEM Charger and Power Adapter for Fire 
Tablets and Kindle eReaders,,,\r\nAmazon 5W USB Official OEM 
Charger and Power Adapter for Fire Tablets and Kindle eReaders,,, 


5 
Amazon Fire Hd 6 Standing Protective Case(4th Generation - 2014 
Release), Cayenne Red,,,\r\nAmazon Fire Hd 6 Standing Protective 
Case (4th Generation = 2014 Release), Cayenne Eod 
5 


New Amazon Kindle Fire Hd 9w Powerfast Adapter Charger + Micro 
Usb Angle Cable,,,\r\nNew Amazon Kindle Fire Hd 9w Powerfast 
Adapter Charger + Micro Usb Angle Cable,,, 
5 

Amazon Kindle Fire 5ft USB to Micro-USB Cable (works with most 
Micro-USB Tablets),,,\r\nAmazon Kindle Fire 5ft USB to Micro- 


USB Cable (works with most Micro-USB Tablets), r, 
4 
Echo slack) apy NIE Nalidyelaro) (Black),,, 
5 
Echo (White),,,\r\nFire Tablet, 7 Display, Wi-Fi, 8 GB - Includes 
Special Offers, Tangerine" 
ii 


Amazon Fire Hd 6 Standing Protective Case(4th Generation - 2014 
Release), Cayenne Red,,,\r\nAmazon 5W USB Official OEM Charger 
and Power Adapter for Fire Tablets and Kindle eReaders,,, 


Echo (Black),,,\r\nAmazon 9W PowerFast Official OEM USB Charger 
and Power Adapter for Fire Tablets and Kindle eReaders,,, 


New Amazon Kindle Fire Hd 9w Powerfast Adapter Charger + Micro 
Usb Angle Cable NENN 


Amazon Fire Tv,,,\r\nKindle Dx Leather Cover, Black (fits 9.7 
Display, Latest and 2nd Generation Kindle DASINI 


Nem : name, dtype: int64 
یمکن أن یکون له أسماء متعددة. لذلك يجب علینا فقط أن نهتم بأنفسنا‎ ASIN أكد الناتج أن کل‎ 
بشکل جید. ولیس آسماء المنتجات.‎ ASIN بشأن ما تفعله‎ 


fig plt.figure(figsize-(16,10)) 

axl = plt.subplot(211) 

ax2 = plt.subplot(212, sharex = axl) 

reviews ["asins"].value_ counts().plot(kind-"bar", ax-axl, 
title="ASIN Frequency") 

np.loglO(reviews["asins"].value counts()).plot(kind-"bar", 
ax-ax2, 
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title="ASIN Frequency (Log10 Adjusted) ”) 
plt.show() 


ASIN Frequency 
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متوسط تصنيف مجموعة بیانات التدريب بالکامل 


print (reviews ["reviews.rating"] .mean() ( 


asins count ix = reviews["asins"].value counts().index 
lt.subplots(2,1,figsize-(16,12)) 

Jig و‎ Sulloyollione (2%, JE 1 

eviews["asins"].value counts().plot(kind-"bar", title-"ASIN 
requency") 

he عم وروت وم‎ (zr JL 2 2 

ns.pointplot(x-"asins", y="reviews.rating", 

rder-asins count ix, data-reviews) 

lt.xticks(rotation-90) 

lt.show() 
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#Add sentiments to the data 


return "Negative" 


"Neutral" 


elif rating 
return 


Possis 


return 


def sentiments (rating) 


.sentiment 


ام المیزات الموجودة, 


باستخد 


^. PERAU 


یمکنه تحدید شعور المرا 
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1183/6 Positive 
dL 7/80.) Positive 
722: Positive 
32638 Positive 
13995 Positive 
6728 Negative 
22009 Positive 
11047 Positive 
22754 Positive 
59/9 Positive 
11673 Positive 
19168 Positive 
14903 Positive 
30843 Positive 
5440 Positive 
28940 Positive 
NZIS Positive 


Name: Sentiment, dtype: object 


المصدر: 


https://thecleverprogrammer.com/2020/05/15/amazon-product- 


/reviews-sentiment-analysis-with-machine-learning 
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Covid-19 Vaccine Covid-19 تحلیل المشاعر تجاه لقاح‎ 1 
Sentiment Analysis 

غير وباء الفیروس التاجي (COVID-19)‏ حياة الناس‌في جمیع آنحاء العالم. لکن ظهور لقاحها 
آدی إلى ردود فعل إيجابية وسلبيةفي جمیع آنحاء العالم.في هذه المقالت سأقدم لك مشروع علم 
البیانات حول تحلیل المشاعر تجاه لقاح Covid-19‏ باستخدام بايثون. 


تحلیل المشاعر تجاه لقاح Covid-19‏ 

قد لا تتوافق الرسائل الاعلامية دائمًا مع العلم OV‏ المعلومات المضللة والادعاءات التي لا أساس 
لها والشائعات يمكن أن تنتشر بسرعة. هذا ما رآیناه مع إدخال لقاح 007101-19 .في مشروع علم 
البيانات هذاء Gag‏ إلى تحليل التغريدات المسجلة حول لقاح Covid-19‏ لتحليل مشاعر 
الناس تجاه اللقاح. 

ile Twitter‏ عن منصة تدوین مصغر وشبکات اجتماعية حیث ينشر المستخدمون رسائل 
تسمی "تغريدات “tweets‏ ویتفاعلون معها. مع آکثر من 166 ملیون مستخدم eg‏ يعد 
Twitter‏ مصدرا GS‏ للبیانات لأي مناقشة على وسائل التواصل الاجتماعي تتعلق بالأحداث 
الوطنية والعالمية. لذلك. تم جمع مجموعة البیانات الخاصة بمهمة تحلیل المشاعر الخاصة 
Covid-19 cla,‏ من Twitter‏ . 


مشروع علوم البیانات حول تحلیل المشاعر المتعلقة بلقاح Covid-19‏ 
سأبداً dogs‏ تحلیل مشاعر لقاح Covid-19‏ عن طریق استیراد جمیع مکتبات بایثون الضرورية: 


مجموعة البيانات 
import numpy as np # linear algebra‏ 
import pandas as pd # data processing, CSV file I/O (e.g.‏ 
pd.read csv)‏ 
import re‏ 
import string‏ 
IMPOSE E Miele‏ 
import matplotlib.pyplot as 1‏ 
import seaborn as sns‏ 
gas Sel SEVEN cami‏ 
import plotly.express as ex‏ 
import plotly.graph objs as go‏ 
import plotly.offline as pyo‏ 


from plotly.subplots import make subplots 

pyo.init notebook mode() 

nltk.download('vader lexicon’) 

from nltk.sentiment.vader import SentimentIntensityAnalyzer as 
SIA 

from wordcloud import WordCloud,STOPWORDS 

from pandas.plotting import autocorrelation plot 

from statsmodels.graphics.tsaplots import plot acf 
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from statsmodels.graphics.tsaplots import plot pacf 
from statsmodels.tsa.seasonal import seasonal decompose 
from nltk.util import ngrams 

from nltk import word tokenize 

from nltk.stem import PorterStemmer 

from nltk.stem import WordNetLemmatizer 

import random 

plt.rc('figure',figsize-(17,13)) 


في الکود أعلاه. سأقوم ببعض المعالجة المسبقة للنص لوظيفة مجموعة البیانات الخاصة iby‏ 
والتي تحتوي على نص التغريدة. هدفنا هو إجراء تحلیل المشاعر على بیانات نصية نظيفة لتجنب 
الضوضاء وأخطاء القراءة: 


f data = pd.read csv('vaccination tweets.csv') 
E data. text =E data. text. str. lowex () 


#Remove twitter handlers 
f data.text = f data.text.apply (lambda 
ss B seres SUBD ) 40 et] qe زر‎ 


#remove hashtags 
f data.text = f data.text.apply (lambda 
x:re.sub(r'\B#\St','',x)) 


# Remove URLS 
f data.text = f_data.text.apply (lambda x:re.sub(r"http\St", 
لاد‎ x)) 


# Remove all the special characters 
۱۶ darao EE = 3e Care eese ocgerodby @lambclage< a 
Tonkin ene nda (as V Xp EDD 


#remove all single characters 
f data.text = f data.text.apply(lambda x:re.sub(r'Nst[a-zA- 
م2 اه‎ VUL xy 


# Substituting multiple spaces with single space 
f data.text = f data.text.apply(lambda x:re.sub(r'Nst', ۲ ', 
x, flags-re.I)) 


تحلیل مشاعر Vander‏ لقاح Covid-19‏ 

يعتمد تحلیل المشاعر VADER J‏ على قاموس يرسم الخصائص المعجمية إلى شدة عاطفية 
تسمی درجات المشاعر sentiment scores‏ یمکن الحصول على درجة المشاعر الخاصة 
بالنص من خلال تلخيص شدة intensity‏ كل كلمةفي النص. 

على سبيل المثال. - کلمات مثل "حب "love‏ » "نقدر "happy A" ۰ "appreciate‏ تنقل 
جميعها شعورًا إيجابيًا. Gad‏ يعد Ly C53 VADER‏ يكفي لفهم السياق الأساسي لمثل هذه 
الکلمات. مثل "غير محبوب "disliked‏ باعتباره Él‏ سلبيًا. ويتضمن Call‏ التركيز على الأحرف 


تحلیل المشاعر تجا 


Covid-19 لقاح‎ o 


III 


الكبيرة وعلامات الترقیم. مثل "استمتع "ENJOY‏ الآن دعنا نجهز البیانات لتحلیل VADER‏ 


للمشاعر: 


= f data['text'].apply (lambda 


SIA() 


'sentiments'] 
polarity scores(' 


'Positive Sentiment'] 


Vsernsimenissiiieaprpislrami dag: Mex aeo ی‎ aril RTRO PSOE OUR) 


'Neutral Sentiment'] 


'sentiments'].apply(lambda x: x['neu']-*1*(10**-6)) 


'Negative Sentiment'] 


'sentiments'].apply(lambda x: x['neg']+1*(10**-6) ) 


ta.drop(columns-['sentiments'],inplace-True) 


تحلیل البیانات الاستکشافية 


'Distriubtion Of Sentiments Across Our 
ts',fontsize-19,fontweight-'bold') 
.kdeplot(f data['Negative S 
.kdeplot(f data['Positive Sentiment'],bw-0.1) 
kdeplot(f data['Neutral Sentiment'],bw-0.1) 
('Sentiment Value',fontsize-19) 

1L 2‏ ,2( وروت عم 
'CDF Of Sentiments Across Our‏ 
ts',fontsize-19,fontweight-'bold')‏ 
kdeplot(f data['Negative‏ 
Sentiment'],bw-0.1,cumulative-1‏ 
sns.kdeplot(f data['Positive‏ 
Sentiment'],bw-0.1,cumulative-]1‏ 
sns.kdeplot(f data['Neutral‏ 
Sentiment'],bw-0.1,cumulative-1‏ 


ntiment'],bw=0.1) 


True) 
True) 


True) 


امد 
(re.findall(r'Nwt',x.lower()))))‏ 


ta 


in 
ta 
ta 
ta 
ta 
ta 
ta 


sid 
:۳ (olei 
ES S 
YO 
E (lel 
f da 
f da 
iE (lel 
15 (olei 
iE و‎ 


f da 


job رن ات تا دک‎ (27, iL, iL) 


title ) 


title ( 


. 101 


PIE 
Twee 
sns 
sns 
SHS, 
joule 
pilie 
pilies 
Twee 
STS 


plt.xlabel('Sentiment Value',fontsize-19) 
plt.show() 


Distriubtion Of Sentiments Across Our Tweets 


—— Negative Sentiment 
— Positive Sentiment 
—— Neutral Sentiment 


04 06 
Sentiment Value 


-0.2 0.0 02 
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CDF Of Sentiments Across Our Tweets 


10  —— Negative Sentiment 
—— Positive Sentiment 
—— Neutral Sentiment 


08 


06 


-0.2 00 02 04 06 08 10 12 
Sentiment Value 


يمكنك ملاحظة أن توزیعات المشاعر تتبع التوزیع الطبيعي normal distribution‏ المشاعر 
السلبية والايجابية متشابهة جدا. مما يوحي بعدم وجود فروق ذات دلالة إحصائيةني قوة المشاعر 
الا يجابية والسلبيةفي بیاناتنا. 


ومن الواضح أيضًا أن الشعور السائد محاید؛ من الغریب أن معظم التغریدات لا تبدو آشبه بمشاعر 
إيجابية أو سلبية محايدة. 


تحلیل المشاعر باستخدام بایئون 
لنبدأ الآن بتحلیل الحد الأقصى للمشاعر السلبية والأكثر ایجابية: 


#Sorting And Feature Engineering 
E darea = £ Cara sore valves (low dA Eel) 


ft data-f data.copy() 

EE da cal cae = pe-to dace EAMe E detal datel) ate 
ft data['year'] = 

pd.DatetimeIndex(ft data['date']).year 

ft data['month'] = 

pd.DatetimeIndex(ft data['date']) .month 

Ew Geral ] = 

pd.DatetimeIndex(ft data['date']).day 

ie Cacal "el oie WEA] = 

pd.DatetimeIndex(ft data['date']).dayofyear 

ice CE EA [| epbieseetee | - 

pd.DatetimeIndex(ft data['date']).quarter 

ft data['season'] = ft data.month$12 // 3 + 1 

OIE. رت طلم كاه‎ )2 1L 7 dL) 

plt.title('Selecting A Cut-Off For Most Positive/Negative 


Tweets',fontsize-19,fontweight-'bold') 
ax0 = sns.kdeplot(f data['Negative Sentiment'],bw-0.1) 
kde x, kde y = axO.lines[0].get data() 


ax0.fill between(kde x, kde y, where-(kde x>0.25) , 
interpolate-True, color='b') 
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plt.annotate('Cut-Off For Most Negative Tweets', xy=(0.25, 
وتان رن(‎ 297 

arrowprops=dict (facecolor='red', 
shrink=0.05), fontsize=16, fontweight='bold') 


ax0.axvline(f data['Negative Sentiment'].mean(), color-'r' 
linestyle-'--') 
ax0.axvline(f data['Negative Sentiment'].median(), 
color-'tab:orange', linestyle-'-') 

plt.legend(('PDF':f data['Negative Sentiment'],r'Mean: 
۱] 2 را من‎ ۲ Ormar هلا‎ daca) Negative 


Sentiment'].mean()):f data['Negative Sentiment'].mean(), 
r'Median: [(:.2f]'.format(f data['Negative 
Sentiment'].median()):f data['Negative Sentiment'].median()]) 


SUDO A, 1 2‏ الس 


axl = sns.kdeplot(f data['Positive 
Sentiment'],bw=0.1,color='green") 


plt.annotate('Cut-Off For Most Positive Tweets', xy=(0.4, 
0.43), xytext=(0.4, 2), 

arrowprops=dict (facecolor='red', 
shrink-0.05),fontsize-16,fontweight-'bold') 
kde x, kde y = axl.lines[0].get data() 
الا عدن نی‎ Jg tween(kde x, kde y, where- (kd _x>0.4) 1 
interpolate=True, color='green') 
axl.set xlabel('Sentiment Strength', fontsize=18) 


exil ayine E تاو‎ MP کر اون‎ Sentimenti | ucan (Or eode 
linestyle-'--') 
axl.axvline(f data['Positive Sentiment'].median(), 
color-'tab:orange', linestyle-'-') 

plt. ۳ mI» CECE [Positive SEE TREES |; 2 Meens 
1] اك و‎ OEMS UE Catal EOS ue 


Sentiment'].mean()):f data['Positive Sentiment'].mean(), 

geciken (eda Ormae Ceta Positive 
Sentiment'].median()):f data['Positive Sentiment'] .median() }) 
plt.show() 


Selecting A Cut-Off For Most Positive/Negative Tweets 


— PDF 
--- Mean: 0.05 
— Median: 0.00 


Cut-Off For Most Negative Tweets 
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— PDF 
=-=- Mean: 0.11 
— Median: 0.00 


Cut-Off For Most Positive Tweets 


04 06 08 10 12 
Sentiment Strength 


الآن دعونا نتخيل آکثر المشاعر سلبية وايجابية: 


Most Positive = f data[f 02۲2 | ۵ 
Sentiment'].between(0.4,1)] 
Most Negative - f data[f data['Negative 
Sentiment'].between(0.25,1)] 


Most Positives Text = 1 ۰:۵۳ (MOSE POS bises) 
Most Negative text = ۲ '.join(Most Negative.text) 


pwc = WordCloud 
False).generate 
nwc = WordCloud 
False).generate 


width=600,height=400,collocations = 
Most Positive text) 
width=600,height=400,collocations = 
Most Negative text) 


(dL, 1‏ لصو ولا ورن 

.title('Common Words Among Most Positive 
ets',fontsize-16,fontweight-'bold') 

. imshow (pwc) 

ees (OEE ( 

Stio lor (il, 272) 

.title('Common Words Among Most Negative 
ets',fontsize-16,fontweight-'bold') 
.imshow(nwc) 

gebat (VOEE) 


(ar (ar @) tor (ar tar far qu tar f 


plt.show() 


Common Words Among Most Positive Tweets Common Words Among Most Negative Tweets 
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oe‏ دعنا نلقي نظرة على pal‏ 10 مشاعر سلبية وايجابية: 
cers‏ اک ان ده ۳ db ag = Most‏ 


wil ciee = CIC (()) 

TOE MOE alin JL e splits 
w= word.strip() 
if w in STOPWORDS: 


continue 
else: 
wl dict[w] = wl _dict.get(w,0)+1 
wl تا نله‎ = (k; yv TO k, مد‎ in )متا هه‎ CIC CEOS O, key—lambda 


item: item[1],reverse=True) } 


l t = Most Negative text 
w2 cice = cuer) 
EOE (roel abo. JL ie syellalic ()) B 
w= word.strip() 
if w in STOPWORDS: 


continue 
else: 
w2 dict[w] = w2_dict.get(w,0)+1 
wa CEE = (s و‎ EO ky ve im خن کنو‎ CIEE. ICES (Oy دهع‎ 


item: item[1],reverse=True) } 


too 10 pos = Matcha (wl عم كك‎ keys) ۱ 0) 
coo LO neg = ان‎ Sie (vu CECE. keye) ETO] 


OIE. ewleredboxe LZ 

w c = WordCloud (width=600,height=400,collocations = 

False, colormap='nipy spectral').generate(' '.join(top 10 pos) ) 
plt.title('Top 10 Words In Most Positive 
Tweets',fontsize-19,fontweight-'bold') 

plt.imshow(w c) 

jolie )كشا ا‎ ERE V )) 

(L 27)‏ هسه فنا هن jobs‏ 

w c = WordCloud (width=600,height=400,collocations = 

False, colormap='nipy spectral').generate(' '.join(top 10 neg) ) 
plt.title('Top 10 Words In Most Negative 
Tweets',fontsize-19,fontweight-'bold') 

plt.imshow(w c) 

Jobi s exa (( ORE V) 

plt.show() 


Top 10 Words In Most Positive Tweets Top 10 Words In Most Negative Tweets 
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دعنا OVI‏ نلقی نظرة على العلاقة بين التغریدات والمیزات الرقمية GS SM‏ مجموعة البیانات: 
ex.imshow(f data[['user followers','user friends','user favour‏ 
ites','user verified','Positive Sentiment, '‏ 


'Neutral Sentiment','Negative 
Sentiment']].corr('spearman'),title-'Spearman Correlation!) 


Spearman Correlation 


1 
user followers 
0.8 
user friends 0.6 
user. favourites 0.4 
0.2 
user_verified 
0 
Positive Sentiment —0.2 
Neutral Sentiment} -0.4 
-0.6 
Negative Sentiment 


لسوء الحظ. لا نری أي ارتباط کبیر بين الشعور بالتغريدة وأي خاصية رقمية آخری موجودةفي 
مجموعة البیانات الخاصة بنا. خاصة تلك التی تصف المستخدمین. آمل أن تکون قد آحببت 
هذه المقالة حول مشروع علم البیانات حول تحلیل لقاح Covid-19‏ باستخدام بایثون. 


المصدر: 


https://thecleverprogrammer.com/2021/01/11/covid-19-vaccine- 
sentiment-analysis/ 


تحلیل مشاعر منشورات فيسبوكت Ty‏ 


Facebook Posts Sentiment تحلیل مشاعر منشورات فيسبوك‎ 2 
Analysis 

يعد Facebook‏ منصة جيدة جدا لأداء مهمة تحلیل المشاعر OV‏ المستخدمین أحرارفي التعبیر 
عن آراتهم حول أي موضوع سواء كان سياسيًا أو a‏ وللمستخدمین حرية مشاركة آرائهم.في 
هذه المقالةء سأقدم لك تحلیل المشاعرفي منشورات Facebook‏ باستخدام التعلم AY‏ 


تحلیل مشاعر Facebook‏ منشورات باستخدام التعلم الآلي 

LOL‏ لمهمة تحلیل المشاعر الخاصة بمنشورات Facebook‏ فأنت بحاجة إلى استخراج 
بیاناتك من Vl Facebook‏ وهي مهمة سهلة للغاية. ما عليك سوی اتباع الخطوات المذکورة 
آدناه: 


1. انتقل إلى الاعدادات والخصوصية. 

2. ثم انتقل إلى الاعدادات. 

3 من الیسان انقر فوق معلومات Facebook‏ الخاصة بك. 
4_انقر فوق عرض‌في تنزیل المعلومات الخاصة بك. 

5. ثم حدد المنشورات فقط وانقر فوق إنشاء ملف. 


سیرسل لك Ghlas! Facebook‏ ال 60 دقيقة القادمة لتنزیل بياناتك. يجب عليك البحث عن 
ملف your posts 1.json'‏ البیانات التي تم تنزیلها . لأننا نحتاج فقط إلى هذه البیانات 
لمهمة تحلیل مشاعر منشورات Facebook‏ باستخدام بایشون. 


تحلیل مشاعر Facebook‏ منشورات باستخدام بایئون 
لنبدأ OY‏ بمهمة تحلیل المشاعرفی منشورات Facebook‏ باستخدام التعلم الآلي باستخدام 
بایغون. Lula‏ باستیراد مکتبات بایشون ومجموعة البیانات اللازمة: 


import pandas as pd 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 
from nltk.stem import LancasterStemmer, WordNetLemmatizer 
from nltk.corpus import stopwords 

from nltk.probability import FreqDist 

import re 

import unicodedata 

import nltk 

import json 

import inflect 

import matplotlib.pyplot as plt 
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import json 
# load json into python, assign to 'data' 
wi EM عون‎ (Vows posts ase!) as Files 
data = json.load(file) 
print (type (data) ) # a list 
print (type(data[0])) # first object in the list: a dictionary 
print (len (data) ) 


«class ‘List'> 
<class 'dict'» 
5038 


نحتاج الآن إلى استخراج الأوصاف من المنشورات حتی نتمکن من تحلیل مشاعر المنشورات. 
سأخزن البیانات النصية لمنشوراتنافي قائمة: 


# create empty list 
empty lst = [] 
# multiple nested loops to store all post in empty list 
for dct in data: 
for Ie, v ia Cera t tens) s 
if k == 'data': 
we dem c Os 
EOE k at, y 1 am ION ECS s 
Ap Je aL == Ipost"; 
empty lst.append(v i) 
DE ME (BEES is EDE anaty lists Y- (Guns sic) 
print("NnLength of list: ", len(empty l1st)) 
EOE 3b an empty lers 
SEE (aL) 


Length of List: 5 
Krish Naik created a Video for 658556858 Must watch! 
Amazing Work by @[100010286773956:2048:Hritika Aggarwal ]é252 


كما تری من الاخراج أعلاه. لدینا قائمة تحتوي على النص الذي كتبتهفي منشوراتي على 

Facebook‏ لقد نشرت فقط حول علم البیانات والتعلم JY‏ على Facebook‏ لذا فإن هذه 

البیانات ليست مثيرة للاهتمام ولکن یمکنك تنفیذ نفس الکود إذا كنت قد نشرت آراء سياسية. 

الکود الذي كتبتهفي شکل یمکن تنفیذه على أي نوع بیانات. 

تحضير البيانات 

سأقوم الآن بإجراء عملية الترميز tokenization‏ على البيانات النصية التي قمنا بتخزينها للتوفي 

قائمة: 
nltk.download('punkt')‏ 


mestec Senrt COken milies emiao tene (LSE) EOE Isic ala 
empty lst] 


تحلیل مشاعر منشورات فيسبوك 119 


# flatten list, len: 1 

flat sent token = [item for sublist in nested sent token for 
item in sublist] 

print ("Flatten sentence token; ", Tem(flat sent token)) 


[nLtR data] Downloading package punkt to /root/nLlth data... 
[nLtR data] | Unzipping tohkenizers/punht.zip. 
FLatten sentence token: 3923 


نحتاج الآن إلى تسوية normalize‏ البیانات. هنا سأقوم بإنشاء بعض الدوال من جل: 
e‏ حذف احرف ASCII „è‏ 
۰ کل الکلمات بحروف صغيرة. 
۰ حذف علامات الترقیم. 
۰ استبدال الرقم. 
o‏ کلمات التوقف. 
bes‏ نری LAS‏ إنشاء دوال لأداء جمیع المهام المذکورة أعلاه لاعداد البيانات لتحلیل مشاعر 
منشورات :Facebook‏ 
def remove non ascii (words):‏ 
new words - []‏ 
for word in words:‏ 
new word = unicodedata.normalize('NFKD', word).encode(‏ 
Vegi! Vaiemers!) ,cacece dE, Vite y‏ 
new words.append(new word)‏ 


return new words 


# To LowerCase 
def to lowercase (words): 


new words - [] 
for word in words: 
new word = word.lower() 


new words.append(new word) 
return new words 


* Remove Punctuation 
def remove punctuation (words): 


new words - [] 
for word in words: 
new word = re.sub(r'[^NwNs]', '', word) 


aie E Wome l= "Ug 
new words.append(new word) 
return new words 


f Replace Numbers with Textual Representations 
def replace numbers (words): 
p = inflect.engine() 
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new words = [] 
for word in words: 
Wie Ozel SOTO )( 2 
new word = p.number to words (word) 
new words.append(new word) 
eser 
new words.append (word) 
return new words 


# Remove Stopwords 
def remove stopwords (words): 
new words - [] 
for word in words: 
if word not in stopwords.words('english'): 
new words.append (word) 
return new words 


# Combine all functions into Normalize() function 
def normalize (words): 

words = remove non ascii (words) 

words = to lowercase (words) 

words = remove punctuation (words) 

words = replace numbers (words) 

words = remove stopwords (words) 


return words 


nltk.download('stopwords') 
sents = normalize(flat sent token) 
print("Length of sentences list: ", len(sents)) 


[nLtR data] Downloading package stopwords to /root/nLlthk data... 
[nLtR data] | Unzipping corpora/stopwords.zip. 
Length of sentences List: 3866 


OYI‏ دعونا نری ما یمکننا تصويرهني هذه البیانات. سوف ألقي نظرة على الجمل الا کثر شيوعًا 
لمعرفة آکثر ما أشاركهفي منشوراتي على :Facebook‏ 


from nltk.probability import FreqDist 
# Find frequency of sentence 

FCM Se gemt > Wiese sie (eiim) 

fdist sent.most common(10) 

# Plot 

fdist sent.plot (10) 
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الخطوة النهائية: تحليل مشاعر منشورات Facebook‏ 

الآن الخطوة الأخيرة هي تحليل مشاعر النص المکتوب‌ي وصف المنشور وإنشاء تقرير لتحليل 
المشاعر على Facebook‏ يوضح ما إذا كانت المشاعر محايدة neutral‏ أو إيجابية positive‏ 
أو سلبية negative‏ 


nltk.download('vader lexicon!) 
sid = SentimentIntensityAnalyzer () 
sentiment = [] 
sentiment2 = [] 
for sent in sents: 
sentl = sent 
sent scores = sid.polarity scores (sentl) 
EOE xx, y aid SONE وهی‎ LEENS) 5 
sentiment2.append((x, y)) 
sentiment.append((sentl, sent scores)) 
# print (sentiment) 
# sentiment 
cols = ['sentence', 'numbers'] 
result = pd.DataFrame (sentiment, columns=cols) 
print("First five rows of results: ", result.head()) 
# sentiment2 


cols2 - ['label', 'values'] 
result2 = pd.DataFrame(sentiment2, columns-cols2) 
print("First five rows of results2: ", result2.head()) 


[nLtR data] Downloading package vader Lexicon to /root/nLlth data... 


First five rows of results: sentence 
numbers 
e krish naik created a video for me must watch {'neg': 0.0, 'neu': 0.778, 


'pos': 0.222, 'comp... 
1 amazing work by 1000102867739562048hritiha agg... {'neg': 0.0, 'neu': 0.513, 
'pos': 0.487, 'comp... 
2 in this article iall walk you through how to c... {'neg': 0.0, 'neu': 0.833, 
'pos': 0.167, 'comp... 
3 machine Learning full course with python for... ('neg': 0.0, 'neu': 0.68, 
'pos': 0.32, 'compou... 
4 practice your skills in data science projects ... {'neg': 0.0, 'neu': 1.0, 'pos': 


0.0, 'compound... 


First five rows of results2: Label values 
e neg 60.000 
neu 0.778 
2 pos 0.222 
3 compound 0.250 
4 neg 60.000 


آمل أن تکون قد أحببت هذه المقالة على تحلیل مشاعر منشورات Facebook‏ باستخدام التعلم 
الآلي باستخدام بایشون. 


تحلیل مشاعر منشورات فيسبوكت 


المصدر: 


https: //thecleverprogrammer.com/2021/01/31/facebook-posts- 


[senüment-analysis 
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Movie Rating Analysis تحلیل تصنیف الفیلم باستخدام بايثون‎ (23 
using Python 

نشاهد جميعًا الافلام للترفیه» والبعض منا لا يقيمها أبدَاء بینما یقوم بعض المشاهدین دائمًا 
بتقييم کل فیلم یشاهدونه. ساعد هذا النوع من المشاهدين‌ني تصنیف الأفلام للأشخاص الذین 
یراجعون مراجعات الفیلم قبل مشاهدة أي فیلم للتأكد من آنهم على وشك مشاهدة فیلم جید. 
لذلك. إذا كنت lide‏ علم البیانات وترغبفي معرفة كيفية تحلیل تقييمات الأفلام باستخدام 
AX‏ برمجة بایثون فهذه المقالة مناسبة لك.في هذه المقالة» سوف آطلعك على مهمة تحلیل 
تصنيف الأفلام Movie Rating Analysis‏ باستخدام بايثون. 


تحليل تصنيف الفيلم باستخدام بايثون 
يساعد تحليل التصنيف الذي قدمه مشاهدو الفيلم العديد من الأشخاص في تحديد ما إذا كانوا 
سيشاهدون هذا الفيلم of‏ لا. لذلك. بالنسبة لمهمة تحليل تصنيف الفیلم. تحتاج أولاً إلى 
مجموعة بيانات تحتوي على بيانات حول التصنيفات التى قدمها كل مشاهد. لهذه المهمة. قمت 
بجمع مجموعة بيانات من Kaggle‏ تحتوي على ملفين: 

1. يحتوي ملف واحد على بيانات حول معرف الفيلم وعنوانه ونوعه. 

2. ويحتوي الملف SW‏ على معرف المستخدم ومعرف الفیلم والتقییمات التي قدمها 

المستخدم والطابع الزمني timestamp‏ للتصنیفات. 

> يمكنك تنزيل مجموعتي البیانات هاتین من هنا. 
لنبدأ الآن بمهمة تحلیل تصنیف الأفلام عن طریق استیراد مکتبات بایثون ومجموعات البیانات 
الضروریة: 


import numpy as np 

import pandas as pd 

movies = Bd Bead CSM (Moves اج تاد‎ E) 
print (movies. head () ) 


e 1e La sortie des usines Lumiére (1895) Documentary | Short 
1 12 The Arrival of a Train (1896) Documentary | Short 
2 25 The Oxford and Cambridge University Boat Race ۰ NaN 
3 91 Le manoir du diable (1896) Short | Horror 
4 131 Une nuit terrible (1896) Short | Comedy | Horror 


في الكود آعلاه. قمت فقط باستيراد مجموعة بيانات الأفلام التي لا تحتوي على أي آسماء أعمدة, 
لذلك byes‏ نحدد أسماء الأعمدة: 


movies.columns = ["ID", "Title", "Genre"] 
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print (movies.head )( 


ID Title Genre 
e 1e La sortie des usines Lumiére (1895) Documentary |Short 
1 12 The Arrival of a Train (1896) Documentary | Short 
2 25 The Oxford and Cambridge University Boat Race ... NaN 
3 91 Le manoir du diable (1896) Short | Horror 
4 131 Une nuit terrible (1896) Short|Comedy|Horror 


الآن Leo‏ نستورد مجموعة بیانات التصنیفات ratings‏ 


tracings = OA. wel eS Ea ARAS da, eikimiti«e m g gY 
print (ratings.head() ) 


1 60114508 8 1381006850 
0 2 499549 9 1376753198 
1 2 1305591 8 1376742507 
2 2 1428538 1 1371307089 
3 3 75314 1 1595468524 
4 3 102926 9 6 


لا تحتوي مجموعة بيانات التصنيف أيضًا على أي أسماء idasi‏ لذلك دعونا نحدد أسماء 
الأعمدة لهذه البيانات أيضًا: 


اه اه ی یی [Usen‏ = وت ري وان 
print (ratings.head() )‏ 


User ID Ratings Timestamp 
e 2 499549 9 1376753198 
1 2 1305591 8 1376742507 
2 2 1428538 1 1371307089 
3 3 75314 1 1595468524 
4 3 102926 9 1590148016 


سأقوم الآن بدمج مجموعتي البیانات هاتينفي واحدة. تحتوي مجموعتي ULSI‏ هاتين على 
عمود ka‏ 2 کمعرف «(ID)‏ والذي يحتوي علی معرف الفیلم. لذلك یمکننا استخدام هذا 
العمود كعمود مشترك لدمج مجموعتی البیانات: 


data = pd.merge (movies, ratings, on=["ID", "ID"]) 
print (data.head()) 


ID Title ... Ratings Timestamp 
6 1e La sortie des usines Lumiere (1895) ... 10 1412878553 
22212 The Arrival of a Train (1896) ... 10 1439248579 
2 25 The Oxford and Cambridge University Boat Race ... ... 8 1488189899 
a 91 Le manoir du diable (1896) ... 6 1385233195 
4 91 Le manoir du diable (1896) ... 5 1532347349 


[5 rows x 6 columns] 


126 تحليل تصنیف الفیلم باستخدام بايثون 


نظرًا لأنها مهمة على مستوی المبتدئین. سأقوم أولاً بالقاء نظرة على توزیع تصنیفات جميع الأفلام التي قدمها 
المشاهدون: 

ratings data["Ratings"] .value_counts() 

numbers = ratings.index 

quantity = ratings.values 

import plotly.express as px 

fig = px.pie(data, values=quantity, names=numbers) 
fig.show() 


هه 


n] 


o 


O M e U bh إن‎ e DO 


لذلك. Gg‏ للمخطط الداثري آعلاه. تم تصنیف معظم الأفلام 8 من قبل المستخدمین. من 
الشکل أعلاه» يمكن القول إن معظم الأفلام تم تصنیفها بشکل ايجابي 

نظرًا oY‏ الرقم 10 هو آعلی تصنیف یمکن للمشاهد تقدیمه. فلنلق نظرة على أفضل 10 آفلام 
حصلت على 10 تقییمات من قبل المشاهدین: 


data2 = data.query("Ratings == 10") 
print (data2["Title"].value_counts() .head(10) ) 


Joker (2019) 1479 
Interstellar (2014) 1382 
1917 (2019) 819 
Avengers: Endgame (2019) 568 
The Shawshank Redemption (1994) 699 
Gravity (2013) 653 
The Wolf of Wall Street (2013) 581 
Hacksaw Ridge (2016) 570 
Avengers: Infinity War (2018) 534 
La La Land (2016) 510 


Name: Title, dtype: int64 
تقییمات من‎ 10 sue على آعلی‎ Joker (2019) حصل‎ ois لمجموعة البیانات‎ Gà y لذلك.‎ 
المشاهدین. هذه هي الطريقة التي يمكنك بها تحلیل تقییمات الأفلام باستخدام بايثون كمبتدئ‎ 
البیانات.‎ ple في‎ 
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الملخص 

هذه هي الطريقة التي يمكنك بها اجراء تحلیل تصنیف الفیلم باستخدام لغة برمجة بایثون کمبتدی 
في ple‏ البیانات. یساعد تحلیل التصنیفات التي قدمها مشاهدو الفیلم العدید من الأشخاصفي 
تحدید ما إذا کانوا سیشاهدون هذا الفیلم أم M‏ آمل أن تکون قد أحببت هذه المقالة حول تحلیل 
تصنیف الأفلام باستخدام بایثون. 


المصدر: 


https://thecleverprogrammer.com/2021/09/22/movie-rating-analysis- 
/using-python 


4 تحلیل المشاعر على تویتر باستخدام التعلم الالي Twitter‏ 
Sentiment Analysis using Machine Learning‏ 

Twitter‏ هو آحد منصات التواصل الاجتماعي حيث یتمتع الأشخاص بحرية مشاركة آرائهم 
حول أي موضوع. نری أحيانًا مناقشة قوية على Twitter‏ حول رأي شخص ما تؤدي آحیانا إلى 
مجموعة من التغریدات السلبية. مع وضع ذلكفي الاعتبارء إذاكنت ترید معرفة كيفية إجراء تحلیل 
المشاعر على Twitter‏ فهذه المقالة مناسبة لك.في هذه المقالة» سوف أطلعك على مهمة تحلیل 
المشاعر على Twitter‏ باستخدام بايثون. 


تحلیل المشاعر على تویتر 

تحلیل المشاعر Sentiment analysis‏ مهمة معالجة اللغة الطبيعية. يجب على جمیع منصات 
وسائل التواصل الاجتماعي مراقبة مشاعر المشارکين‌في المناقشة. نری‌في الغالب آراء سلبية على 
تویتر عندما تکون المناقشة سياسية. لذلك. يجب أن تستمر کل منصةفي تحلیل المشاعر للعثور 
على نوع الأشخاص الذین ینشرون الكراهية والسلبية على نظامهم الأساسي. 


بالنسبة لمهمة تحلیل المشاعر على Twitter‏ قمت بجمع مجموعة بیانات من Kaggle‏ تحتوي 
على تغريدات حول مناقشة db gh‏ داخل مجموعة من المستخدمین. مهمتنا هنا هی تحدید عدد 
التغريدات السلبية والايجابية حتی نتمکن من اعطاء نتيجة. لذلك.في القسم alil‏ سأقدم لك 
مهمة تحلیل المشاعر على Twitter‏ باستخدام بايثون. 


تحلیل المشاعر على Twitter‏ باستخدام بایئون 
لنبداً مهمة تحلیل المشاعر على Twitter‏ من خلال استیراد مکتبات بايثون ومجموعة البیانات 
اللازمة: 


import pandas as pd 

import numpy as np 

from sklearn.feature extraction.text import CountVectorizer 
from sklearn.model selection import train test split 

from sklearn.tree import DecisionTreeClassifier 

import re 

import nltk 

import nltk 


data - 

pd.read csv ("https://raw.githubusercontent.com/amankharwal/Website- 
data/master/twitter.csv") 

print (data.head()) 
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Unnamed: @ count hate_speech offensive_language neither class \ 


6 e 3 e e 3 2 

il 3 e 3 e 1 

2 2 3 e 3 e 1 

3 3 3 e 2 1 il 

4 4 6 e 6 e d 
tweet 

0 !!! RT @mayasolovely: As a woman you shouldn't... 

e 11 RT @mleew17: boy dats cold...tyga dwn ba... 

e 1! RT @UrKindOfBrand Dawg!!!! ۴ ۰. 

zy I ! RT QC G Anderson: Qviva based she lo 

4 ۱۱۱۱۱۲۲۱۲۱۲۱۲ RT @ShenikaRoberts: The shit you 


يحتوي عمود التغريدات Utweet column‏ مجموعة البیانات آعلاه على التغريدات التي نحتاج 
إلى استخدامها لتحلیل مشاعر المشاركينفي المناقشة. ولکن للمضي قدمًاء يتعين علینا تنظیف 
الکثیر من الأخطاء والرموز الخاصة الأخرى OV‏ هذه التغریدات تحتوي على الکثیر من الأخطاء 
اللغوية. إذن إليك كيف یمکننا تنظیف عمود التغريدة: 


nltk.download('stopwords') 

stemmer = nltk.SnowballStemmer ("english") 
from nltk.corpus import stopwords 

ümport string 

stopword=set (stopwords.words('english')) 


def clean(text): 
text = str(text).lower() 
text = Fe see Ce Vl eo, “So text) 
text LEE SOS MEEPS VI SWS, Uo) text) 
text = Fe. SUD (U< Peary, TT, text) 
text = re.sub('[$s]' $ re.escape(string.punctuation), '', text) 
text = aa ara uq E text) 
text = re.sub('\w*\d\w*', '', text) 


text = [word for word in text.split(' ') if word not in stopword] 
text-" ".join(text) 

text = [stemmer.stem(word) for word in text.split(' ')] 

text-" ".join(text) 


return text 
data["tweet"] = data["tweet"] .apply (clean) 


الآن الخطوة التالية هی حساب درجات المشاعر لهذه التغریدات وتعیین تسمية للتغریدات على 
آنها ايجابية positive‏ آو .4 negative‏ أو محايدة neutral‏ . اليك Cle Lis‏ درجات 
المشاعرفي التغریدات: 

from nltk.sentiment.vader import SentimentIntensityAnalyzer 


nltk.download('vader_lexicon') 
sentiments = SentimentIntensityAnalyzer () 


data["Positive"] = [sentiments.polarity scores(i)["pos"] for i in 
data["tweet"]] 
data Negative | = Sentiments. polarity SEES) | Med | rom 2 ۵ 
data["tweet"] ] 
data["Neutral"] = [sentiments.polarity scores(i)["neu"] for i in 
data["tweet"]] 
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الآن سأختار فقط الأعمدة من هذه البیانات التی نحتاجها لبقية مهمة تحلیل المشاعر على 
Twitter‏ : 
data = data[["tweet", "Positive",‏ 
"Negative", "Neutral"] ]‏ 


print (data.head() ) 


tweet Positive Negative \ 


@ rt mayasolov woman shouldnt complain clean ho... 0.147 0.157 

1 rt boy dat coldtyga dwn bad cuffin dat hoe ... 0.000 0.280 

2 rt urkindofbrand dawg rt ever fuck bitch sta... 0.000 0.577 

3 rt cganderson vivabas look like tranni 0.333 0.000 

4 rt shenikarobert shit hear might true might f... 0.154 67 
Neutral 

e 0.696 

3 0.720 

2 0.423 

3 0.667 

4 0.440 


bes‏ الآن نلقی نظرة على التصنيف الأكثر شیوعٌا المخصص للتغریدات Giy‏ لدرجات المشاعر: 


x = sum(data["Positive"]) 
sum (data["Negative"]) 


< 
Il 


2 = sum(data["Neutral"]) 


deh SenEImenE ره و هد‎ OS CES 
if (a>b) and (a>c): 
print ("Positive & ") 
elif (b>a) and (b>c): 
print ("Negative ® ") 
else: 


print ("Neutral 9 vy 


Scoren Vo 2)‏ تا عه 


Neutral @‏ 
لذا فإن معظم التغریدات محايدة. ما يعني آنها ليست إيجابية ولا سلبية. OW‏ دعنا نلقي نظرة على 
إجمالى درجات المشاعر: 


۱21810۲ ) 551 6106 UL sx) 
print("Negative: ", y) 
preine Neutral مرب‎ 2( 


Positive: 0 0009 
Negative: 2 
Neutral: 14696.887999999733 
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مجموع التغريدات المحايدة أعلى بكثير من السلبية والإيجابية» لكن من بين جميع التغريدات 
السلبية أكبر من التغريدات الإيجابيةء لذلك يمكننا القول إن معظم الآراء سلبية. 


الملخص 

هذه هي الطريقة التي يمكنك بها أداء مهمة تحليل المشاعر على Twitter‏ باستخدام لغة برمجة 
بايثون. تحليل المشاعر مهمة معالجة اللغة الطبيعية. تحتاج جميع منصات وسائل التواصل 
الاجتماعي إلى التحقق من مشاعر الأشخاص المشاركينني المناقشة. آمل أن تكون قد أحبيت 
هذا المقال على تحليل المشاعر على Twitter‏ باستخدام بايثون. 


